[자격증][필기] 빅데이터 분석기사 8회 필기 분석 및 후기

Posted by ash tensor on May 03, 2024 · 5 mins read 카테고리
카테고리 링크
📁 자격증

[자격증][필기] 빅데이터 분석기사 8회 후기

합격 인증

일단 합격 인증부터 올린다. 지난 4월경에 본 시험인데, 약 2주 정도 시험 공부를 했던 것 같다. 하루에 약 세시간 정도 공부했고, 책은 이기적의 빅데이터 분석기사 필기 책을 통해서 공부했다.

시험 내용

시험이 4과목으로 나뉘어져 있는데 1과목은 빅데이터 분석 기획, 2과목은 빅데이터 탐색, 3과목은 빅데이터 모델링, 4과목은 빅데이터 결과 해석으로 나뉘어져 있다. 1과목은 빅데이터에 대한 개론 및 기획에 대한 내용이고, 2과목은 주로 통계 기법에 대한 내용을 다룬다. 예를 들어서 통계 기법 중에서도 가설 검정, 회귀분석, 군집분석, PCA 등에 대한 내용이 나오고 간단한 계산 문제도 같이 출제된다.(ex. z값 계산, z값을 이용한 추정 등)

그리고 3과목은 모델에 관한 내용이 출제되는데 회귀분석, 의사결정나무, SVM, ANN, CNN, RNN 등 다양한 인공신경망과 머신러닝 기법, 그리고 그 특징에 대해 출제된다. 4과목은 3과목과 (내가 느끼기엔) 그렇게 큰 차이는 없는 것 같다. 3과목에서 나온 내용을 바탕으로 해당 모델을 해석하는 방법 등을 물어보는데, 오즈비나 precision, recall, F1 score 등에 대한 내용을 빼면 결국에는 모델의 특징을 물어보는 문제가 주가 되기 때문이다.

그래서 나중에 데이터 카페에서도 문제를 복원할 때, 문제는 77문제 가까이 복원했지만 해당 문제가 어떤 과목인지 까지는 복원하지 않아서 본인이 과락할지도 모르겠다고 겁먹은 사람들도 있었다.

그런데 그럴 수 밖에 없겠다고 느꼈던 이유 중에 하나가 이번 시험 문제가 꽤 어려웠기 때문이다!! 특히 3과목은 정말 어려웠다고 원성이 자자했다.

시험 보기 전에 이전 기출 회차를 거의 다 풀어보고 나서 시험을 봤는데, 7회 기출문제 수준이 아니어서 깜짝 놀랐다. 이번 8회차가 어려웠던 이유는 문제가

개념에 대해 완벽하게 알고 있는지

를 물어보기 때문이었다고 생각한다. 예를 들어서, 복원된 PCA문제를 보자.

[14] 주성분 분석(PCA)에 대한 설명으로 옳은 것을 모두 고르시오

(가) 정규성을 가정한다(뭐 이런 느낌의 선지였던 것 같다)

(나) 차원축소는 변수들간에 관계가 없어도 가능하다

(다) 분산이 크다

1. (가)

2. (다) ✅

3. (가), (다)

4. (가), (나), (다)

이런 식으로 출제되었는데, 일단 문제 자체가 (가) 를 모르면 풀 수 없게 설계가 되어 있고, (가)만 알아도 문제를 맞출 수 있었다. 나는 시험장에서 PCA가 정규성을 가정하지 않아도 된다는 것을 알고 있기 때문에 (가)를 제외하고 나니 남은 선지가 (다) 뿐이 없어서 2번을 선택했었는데 PCA가 주성분 분석이라는 것, 각각 주성분에 대한 분산을 최대화 한다는 것을 대강 알고 있는 것 만으로는 풀 수 없는 문제였고, 선형회귀와 로지스틱회귀 등에 대한 다음 문제를 보자.

[58] 선형회귀와 로지스틱회귀에 대한 설명으로 옳지 않은 것

1. 종속변수가 범주형인 경우 로지스틱 회귀 사용

2. 선형, 로지스틱 회귀 모두 잔차 정규성을 가정 ✅

3. 선형회귀 계수 LSE로 추정하면 불편추정량 ~~

4. 선형, 로지스틱 회귀 모두 MLE로 계수추정 가능

이런 식으로 출제되었는데, 이 문제도 마찬가지로 선형회귀와 로지스틱회귀에 대한 개념을 완벽하게 알고 있어야 풀 수 있는 문제였다. 따라서 데이터 카페에서도 해당 회차에 대해 매우 어렵다는 의견이 많았다.

공부법

일단 대학교에서 3학점짜리 통계학 과목을 하나라도 수강했던 사람이라면 2과목 공부량이 매우 줄어들어서 3, 4 과목만 공부하면 된다. 여기에 전공자이거나 해서 해서 머신러닝, 딥러닝에 대한 지식이 있는 사람이라면 3, 4과목에서 도움을 받을 수 있다. 그리고 데이터진흥원 시험은 계산기를 허용하지 않기 때문에 엄청 큰 수식을 계산하는 문제는 거의 나오지 않는다. 기껏해야 기본적인 통계 계산 정도가 전부이다. z값 계산과 같은 각 통계 분포의 기초적인 통계량 계산과 검정 정도만 출제되기 때문에 대학에서 3학점으로 개설되는 기초 통계학이나 확률통계 과목들보다 난이도 자체는 더 쉽다.

그리고 3, 4과목은 머신러닝과 딥러닝에 대한 내용이 출제되는데, 8회차를 보면서 개인적으로는 단순히 책을 달달 외우는게 좋은 공부법은 아니라고 느꼈다. 빅데이터 분석기사가 정보처리기사와는 다르게 단순히 기출문제를 많이 풀어서 키워드 기반으로 넓고 얕게 공부하는 것은 도움이 되지 않는것 같다. 아직 시행된지 얼마 안 돼서 그럴 수도 있지만, 매 회차 과거 기출과 비슷한 문제가 나온다기 보다는 새로 출제되는 문제가 많기 때문이다.

따라서 해당 개념을 가지고 GPT에 물어보거나 아니면 다양한 자료를 접하면서 시험에 출제되는 개념을 다양하게 기억하는 것을 추천한다.

합격률

출처 : 8회 빅데이터 분석기사 필기 합격률

솔직히 나도 시험을 보면서 꽤나 어려웠다고 생각했는데, 8회차 합격률은 꽤나 높은 52.6%에 달했다. 이러면 앞으로도 시험이 쉬워지거나 하지는 않을 것으로 예상된다. 1년에 두번밖에 볼 수 없는 시험이니만큼 준비를 확실히 하는 편이 좋겠다고 생각이 든다.

나의 경우는 대학교에서 확률 통계 과목을 수강했고, 머신러닝, 딥러닝에 관한 과목도 한학기씩 수강해서 해당 과목들을 통해 얻은 지식이 많은 도움이 되었다. 물론 그렇다고 하더라도 모든 것을 기억하고 있지는 않는 데다가, 앞서 말했듯이 키워드 기반 넓고 얕게 아는 것보다는 나오는 내용을 중심으로 자세히 아는 것이 더 중요하기 때문에 약 2주 정도 하루에 세시간 정도씩 공부했다.

비전공자인 경우에는 이보다 조금 더 공부해야 안정적으로 합격할 수 있지 않을까 싶다.


Thanks. mind sharing?

← Previous Post Next Post