빅데이터 분석기사 7회 실기 시험에 최종 합격하였다.
작년부터 시작되었던 기나긴 여정이 올해 드디어 끝나게 되었다.
https://aitzone.tistory.com/35
작년 이맘때쯤 처음 치루었던 5회 시험부터 이번 시험까지 삼수만에 붙은 시험이다.
조금 부끄럽긴 하지만, 핑계아닌 핑계를 대자면 5회때에는 회사를 다니며 대학원 면접을 준비를 하면서 어영부영 병행하면서 책 한권도 제대로 못본 상태로 들어갔고 6회때에는 시험 전날 대학원 워크샵으로 인해 필수코드 암기 및 정리를 하지못한 상태로 들어가서 불합격의 고배를 마시게 되었다.
이번 7회 시험도 사실 온전하게 준비를 할 상황이 아니였고, 시험 이틀전 서울에 학교행사로 갈일이 있어서 서울에 간 상황에서도 계속 정리를 하며, 공부를 하였다.
(다행히 하루전에는 온전하게 시험준비에만 신경을 썼던 부분이 유효하게 작용하였던 것 같다.)
하루 전날이 무엇보다도 중요한 시험
결론적으로 합격을 하게 되었고, 졸업요건을 충족함과 동시에 생애 첫 기사 시험을 취득하게 되어서 기쁘다.
시험 준비를 하는 분들을 위한 중요한 팁들을 적겠다.
1. 실기 시험의 방향성이 계속 매회차마다 바뀌고 있는 시험이다. 향후 계속 어떻게 바뀔지는 모르겠으나, 시중에 나와있는 실기 수험서에 계속 바뀌는 경향성이 적용이 되는지 매회차마다 확인을 해야 한다.
https://www.dataq.or.kr/www/board/notice/list.do
본 데이터자격검정 사이트 공지사항을 시험전에 안내 사항이 있는지 필히 확인을 해야 한다.
2. 이러한 경향성 변동으로 인해서 교재보다는 무조건 전문강사의 인터넷 강의를 추천한다. 교재는 시험이 계속 바뀌는 경향성으로 인해서 24년 버전의 책일지라도 바뀐 유형이 적용 안된 것들이 많으며 특히 23년까지의 교재들은 무조건 비추천한다. 검색을 하면 여러 강의가 나오고 각종 커뮤니티에서 언급이 되는 매해 시험경향을 반영하여 업데이트가 꾸준히 되고 있는 질좋은 강의가 몇개 있는데 다소 부담스러운 금액을 투자하더라도 인터넷 강의를 수강하고 복습하면 빠른 합격의 길로 갈 것이다. (검색해보면 몇몇 시중강의들은 아직까지도 경향성이 바뀐것을 업데이트 하지 않은 것들이 많아 보인다. 수강후기를 잘 확인해보고 강의 목차를 필히 확인해보고 신경향이 반영된 것만 구매하여 시청할 것을 추천한다.)
3. 모든 시험이 그렇지만, 시험 하루전이 가장 중요한 시험이다. 코드 전체를 보면 절대로 어려운 시험이 아니지만, 자동완성이 없다는점, 구글링이 아예 안된다는 점때문에 하루전에는 무조건 내가 작성할 코드에 대한 시뮬레이션과 함께 베이스라인을 통으로 외워서 들어가야하며, help()함수나 dir()함수는 정말 보조수단으로 활용해야한다는 생각으로 기출 또는 모의고사 문제를 교재나 인강의 답이 아닌 내가 직접 처음부터 다 짜보고 실행까지 시켜보는 연습이 필요하다.
유형1의 판다스는 오히려 유형2보다도 꾸준히 많은 연습을 해야 한다. 이 부분은 실제로 정형화된 데이터를 다루는 직군이라면 실무경력을 높인다는 생각으로 재미있게 공부할수 있는 부분이다.
학습적인 부분에서의 팁이다.
1. 파이썬의 기본적인 역량(함수나 클래스 생성은 필요X)과 판다스와 기본적인 머신러닝(사이킷런)을 학습하고 평가할줄 알고 있어야 하며, 통계 라이브러리인 scipy와 statsmodels 라이브러리를 활용할줄 알아야 한다.
2. 유형1은 판다스의 사용 역량을 측정하는 시험이다.
인터넷 강의나 개인이 올려놓은 pandas 연습문제 사이트 등이 있는데, 계속 연습하여 컬럼에서 정보를 추출하고 변형하는 연습이 충분히 필요한 시험이다.
3. 유형2에서의 만점이 중요한 시험이다. help()함수나 dir()함수를 사용하여 cheatsheet를 확인하는 것은 불법이 아니지만, 여기서 제공하는 베이스라인 코드로는 힘들수도 있다. 본인만의 머신러닝 모델링의 루틴을 만들어서 기계적으로 코드를 작성하고 하이퍼파라미터 튜닝을 안하는 경우가 안전하다지만, 본인은 하이퍼파라미터값을 찾아서 최적화된 값으로 제출을 하였다. 이러한 부분들은 회귀나 분류모델 평가지표로 확인하고 가장 나은 모델을 제출하는 것을 추천한다.
랜덤포레스트나 lightgbm 을 추천한다. 라벨링이나 스케일링 같은 전처리도 자신에게 최적화된 코드를 실험해보고 찾아서 외우는 것을 추천한다.
4. 유형3은 6회때부터 등장한 신유형으로 지금 현재에도 계속 변하고 있다. 아마도 statsmodels 라이브러리만을 잘 활용하는 문제로 고착화되고 있는데,
위와 같은 통계 테이블에서의 해석능력을 요구하는 유형으로 완전히 정착화 될 것으로 보인다.
각각의 통계 지표가 무엇인지 정확하게 아는 지식이 필요하다. (Kurtosis가 뭔지, R^2값이 뭔지 이러한 것들이 소문제의 질문이 될 수 있으며, 어렵게 나온다면 정말 평소에 잘 보지 않는 지표 같은 것들도 물어 볼수가 있다.
다음은 시험환경에서의 팁이다.
https://dataq.goorm.io/exam/3/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/1
1. 위 사이트는 데이터자격검정 사이트에서 제공하는 시험환경이다.
구름 IDE라는 클라우드 환경에서 시험이 실시되며, 일반적인 visual studiocode나 주피터노트북 또는 코랩환경과는 다소 차이가 있다.
셀이 나누어져 있지않으며, ctrl + Enter 또는 shift + Enter 실행이 아닌 직접 마우스 실행 버튼을 눌러서 코드를 동작시키는 환경이다.
이러한 환경에서 예시문제를 여러번 풀어서 들어가는 것을 필히 추천하는 바이며, 7회 시험부터는 윈도우 메모장 이용이 불가능한 구조로 바뀌었다.
이 메모장을 클릭하면 각 문제마다의 코드나 답을 적을수 있는데, 창이 닫히더라도 문제1, 문제2에 입력해놓은 부분들이 저장이 되어서 오히려 윈도우 메모장보다 훨씬 편안한 부분이었다.
기본적으로 라이브러리 import부터 baseline code를 시험 시작과 동시에 써놓고 시작하는 것을 추천하는 바이다.
답안 제출 방식 역시 이전 시험과는 다르게 7회부터는 코드를 실행시켜 얻은 답을
다음과 같은 다른 페이지에 직접 입력하여 넣는 방식으로 바뀌었다는 점이다.
print문을 써서 답을 내는 방식이 아니여서 오히려 중간과정인 코드야 어떻든 간에 안전하게 답만 도출해내서 제출하면 정답으로 인정되는 부분이여서 수험자 입장에서는 편리하게 개선된 상황이라고도 볼수 있다.
아직까지도 정보처리기사나 다른 기사시험 처럼 유형이 정형화 되어 있지 않고 매회 예상하지 못한 방향으로 유형이 끊임없이 바뀌고 있는 논란도 많고 탈도 많은 시험이지만, 여러 응시목적을 가지고 준비하는 사람이 늘어나고 있는 시험인 만큼 본 포스팅을 보는 모든 분들이 합격의 성취를 얻었으면 하는 바람이다.
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
[5회 빅데이터분석기사 실기] 시험 후기와 고찰 (0) | 2022.12.05 |
---|---|
[빅데이터분석기사] 시험환경 (설치된 파이썬 패키지 리스트) (0) | 2022.11.29 |
[빅데이터분석기사] 작업 2유형 작성패턴 - 회귀문제 (2) 시간데이터 (0) | 2022.11.26 |
[빅데이터분석기사] 작업 2유형 작성패턴 - 회귀문제(1) (2) | 2022.11.24 |
[빅데이터분석기사] 작업 2유형 작성패턴 - 분류문제 (6) | 2022.11.21 |