반응형

빅데이터분석기사 실기 6

[7회 빅데이터분석기사 실기] 최종합격후기

빅데이터 분석기사 7회 실기 시험에 최종 합격하였다. 작년부터 시작되었던 기나긴 여정이 올해 드디어 끝나게 되었다. https://aitzone.tistory.com/35 [5회 빅데이터분석기사 실기] 시험 후기와 고찰 12월 3일 5회 빅데이터분석기사 실기 시험을 보았다. 고사장은 더조은아카데미 대구지점으로 메가스터디 계열학원으로 컴퓨터 학원이다. 시설은 깔끔하였고 대구 고사장 3곳 중 1곳으로 나머지 2 aitzone.tistory.com 작년 이맘때쯤 처음 치루었던 5회 시험부터 이번 시험까지 삼수만에 붙은 시험이다. 조금 부끄럽긴 하지만, 핑계아닌 핑계를 대자면 5회때에는 회사를 다니며 대학원 면접을 준비를 하면서 어영부영 병행하면서 책 한권도 제대로 못본 상태로 들어갔고 6회때에는 시험 전날 대..

[빅데이터분석기사] 시험환경 (설치된 파이썬 패키지 리스트)

5회 시험기준 [패키지 리스트 확인 명령어] 응시환경에서 아래 명령어를 이용하여 설치된 패키지를 확인할 수 있습니다. import pkg_resources import pandas OutputDataSet = pandas.DataFrame(sorted([(i.key, i.version) for i in pkg_resources.working_set])) print(OutputDataSet) [패키지 리스트] 0 asn1crypto 0.24.0 1 beautifulsoup4 4.9.3 2 certifi 2018.1.18 3 chardet 3.0.4 4 cryptography 2.1.4 5 cycler 0.10.0 6 cython 0.29.24 7 distlib 0.3.2 8 idna 2.6 9 joblib..

[빅데이터분석기사] 작업 2유형 작성패턴 - 회귀문제 (2) 시간데이터

빅데이터 분석기사 시험에서는 회귀 문제중에 시간데이터를 다룰 확률이 높다. 사실 강의나 책마다 다루는 경우가 있고 다루지 않는 경우도 있으나, 추가적으로 다루어 보고자 한다. 데이터셋의 경우에는 x_train, x_test, y_train이 나누어 지지 않은 경우로 진행도 해보았지만, 실제로 dataq.or.kr 홈페이지에 들어가서 실습환경을 보면 3개의 데이터가 분리되어 있고 최종적으로 y_test값을 제출하는 형식이라서 이번에는 나누어져 있는 데이터로 진행을 해보려고 한다. (실제 실무에서는 이렇게 친절하게 나눠져 있지 않고, 앞으로의 출제 형식 자체도 전체 데이터 하나를 직접 나누어서 해야할 수 도 있을 것 같다.) 1. 데이터 read import pandas as pd import numpy a..

[빅데이터분석기사] 작업 2유형 작성패턴 - 회귀문제(1)

작업 2유형 분류문제에 이어서 회귀문제 코드패턴을 다루고자 한다. 사실 분류 모델과 비교 했을때, 전반적으로 달라지는 것들은 없으나, 정형화 공식 (역시 4개 파트로 나눌 수 있다.) 1. 데이터 가져오기 2. 결측치 확인 및 대체하기(제거하기) ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ 3. 라벨 인코딩 (범주형 -> 수치형) 4. 원핫 인코딩 (범주형 ->수치형) * 3, 4 부분에서 수치형 -> 범주형 같은 경우에는 binning의 과정을 해야 된다. (회귀(예측) 문제일 경우) 5. 파생변수 생성 6. 스케일링 (1. StandardScaler 2. MinMaxScaler) 1은 범주형 데이터일 경우 2는 수치형일 경우 변환해준다. ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ..

[빅데이터분석기사] 작업 2유형 작성패턴 - 분류문제

빅데이터 분석기사의 2유형은 전체 100점 배점중 40점을 차지하는 한 문제가 나온다.필답형 문제 (30점)이나 1유형 (30점)을 만점을 받을 자신이 있으면 날려도 되지만, 보통 그렇게 하기 힘든 부분이다.그래서 꼭 부분점수라도 받아야 하는 파트이다. 머신러닝 모델링을 하여 결괏값을 내는 것 이외에도 마지막에 저장을 해서 제출하여야 한다.(1유형은 print함수로 결과값만 스크린에 출력하면 된다.) 현재까지의 기출이나 교재를 봤을때의 정형화 시킨 공식은 다음과 같다.사람마다 작성법이 달라지고 코딩 스타일이 다르므로 이 틀에서 살만 덧붙이면 될 것 같다. 정형화 공식 (4개파트로 나눌 수 있다.)1. 데이터 가져오기2. 결측치 확인 및 대체하기(제거하기)ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ..

[빅데이터 분석기사 실기]빅데이터 분석기사 실기 with Python 데이터에듀

데이터 에듀에서 새롭게 발간된 빅데이터 분석기사 실기 책이다. 데이터 에듀는 ADsP 시험에서 유명한 일명 민트책을 출간하는 출판사이다. 사실 민트책은 바이블이라고 할 정도로 ADsP 수험서 시장에서 점유율 1위를 하고 있는 책이다. 통계를 내어 보진 않았지만, 내가 운영진으로 있는 데이터 포럼 카페에서는 압도적으로 책에 관련된 질문이 많이 올라온다. 나머지 책은 언급되는 정도가 거의 전무한 수준 물론 필자는 ADsP 자격증을 취득했지만, 타 출판사의 책을 이용했었고 민트책으로 한번도 공부해본 적이 없었다. 때마침 이벤트로 당첨이 되어서 같은 출판사에서 출간된 빅데이터 분석기사 실기책을 받게 되었다. 원서접수 소개, 이번달에 발간된 책인 만큼 내년 예상 일정 소개까지 되어있다. 실기 응시료는 40800원..

반응형