반응형

파이썬 6

[빅데이터분석기사] 작업 2유형 작성패턴 - 회귀문제(1)

작업 2유형 분류문제에 이어서 회귀문제 코드패턴을 다루고자 한다. 사실 분류 모델과 비교 했을때, 전반적으로 달라지는 것들은 없으나, 정형화 공식 (역시 4개 파트로 나눌 수 있다.) 1. 데이터 가져오기 2. 결측치 확인 및 대체하기(제거하기) ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ 3. 라벨 인코딩 (범주형 -> 수치형) 4. 원핫 인코딩 (범주형 ->수치형) * 3, 4 부분에서 수치형 -> 범주형 같은 경우에는 binning의 과정을 해야 된다. (회귀(예측) 문제일 경우) 5. 파생변수 생성 6. 스케일링 (1. StandardScaler 2. MinMaxScaler) 1은 범주형 데이터일 경우 2는 수치형일 경우 변환해준다. ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ..

[빅데이터분석기사] 작업 2유형 작성패턴 - 분류문제

빅데이터 분석기사의 2유형은 전체 100점 배점중 40점을 차지하는 한 문제가 나온다.필답형 문제 (30점)이나 1유형 (30점)을 만점을 받을 자신이 있으면 날려도 되지만, 보통 그렇게 하기 힘든 부분이다.그래서 꼭 부분점수라도 받아야 하는 파트이다. 머신러닝 모델링을 하여 결괏값을 내는 것 이외에도 마지막에 저장을 해서 제출하여야 한다.(1유형은 print함수로 결과값만 스크린에 출력하면 된다.) 현재까지의 기출이나 교재를 봤을때의 정형화 시킨 공식은 다음과 같다.사람마다 작성법이 달라지고 코딩 스타일이 다르므로 이 틀에서 살만 덧붙이면 될 것 같다. 정형화 공식 (4개파트로 나눌 수 있다.)1. 데이터 가져오기2. 결측치 확인 및 대체하기(제거하기)ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ..

[Python] glob함수 사용

Python에서 데이터 분석을 위해서 데이터들을 가져오게 된다. 정형데이터나 비정형 데이터와는 상관없이 파일의 양이 많은 경우가 대부분이다. 판다스를 사용하기 위해서 excel파일이나 csv파일을 불러오는 예시를 보자. df = pd.read_excel('/content/data_01/data_day_2019.xlsx') # excel 불러오기 df df = pd.read_csv('/content/data_01/data_day_2019.csv') # csv 파일 read df 변수명인 df를 참조하고, pd.read_csv나 pd.read_excel을 입력하고 괄호안에 파일 경로를 입력해준다. ('파일이 있는 경로 입력') 물론 pd를 쓰려면 판다스 라이브러리를 import 해 놓은 상태여야 한다. im..

Python/Basic 2022.11.07

[Colab] Matplotlib 한글 미지원 ( 한글 깨짐 현상)

코랩에서 데이터로 그래프를 그리다보면 한글을 넣어야 하는 경우 깨져서 나오는 경우가 있다. 여러가지 방법들이 있지만, 한번에 해결하는 방법이 있다. !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf 위의 code를 넣어서 셀을 실행 시킨다. ( 앞의 느낌표는 무조건 넣어주어야하며, 리눅스 기반으로 구동되는 것이라서 sudo, rm같은 것들은 linux 명령어들이다.) 나눔 폰트를 설치하고 matplotlib 라이브러리를 초기화 시키는 코드라고 생각하면 된다. 설치후에 다시 시작하고 나면 코랩에 업로드 한 파일이 초기화 되지는 않지만, 앞에서 작성했던 코드들을 다시 실행해주어야 한다. Shift + Ente..

Python/Matplotlib 2022.10.12

[파이썬]포매팅(formatting) 총정리 - 1

파이썬에서는 표현식 기반 문자열 조합이라고 불리는 포매팅(formatting)의 방법이 존재한다. 변수로 지정된 문자(string)이나 숫자(integer, float)를 화면에 출력하기 쉽도록 하는 방법으로 생각하면 된다. 필자는 해커톤에서 사용을 해봤는데, 문법이 은근히 헷갈려 정리를 해보려고 한다. # 1. # String formatting expressions '표현식'을 기반으로 문자열을 조합하기 '__%s_%s__' % (value, value) 스타일 문자열 조합 # 2. # String formatting method calls '메소드 호출'을 통해 문자열 조합하기 '__{}_{}__'/format(value, value) 스타일 문자열 조합 #3. # f-string f'__{변수} ..

Python/Basic 2022.09.08
반응형