안녕하세요 늑대양입니다 :)
이번 주와 다음 주 초까지 EDA 프로젝트가 진행됩니다!! 🤓
오늘은 [AI 데이터 사이언티스트 취업 완성 과정]의 36일차 일과를 정리하여 안내해드리도록 하겠습니다.
Day 36 시간표:
- 미니 프로젝트: EDA
- 미니 프로젝트: EDA
미니 프로젝트: EDA
담당 데이터 확인
아파트 규모별 매매 실거래 평균가격
Data URL: https://kosis.kr/statHtml/statHtml.do?orgId=408&tblId=DT_KAB_11672_S19&vw_cd=&list_id=00000168&scrId=&seqNo=&lang_mode=ko&obj_var_id=&itm_id=&conn_path=R1&path=
데이터 정보 요약:
- 행정구역 정보: 전국, 서울, 수도권, 지방
- 시점 정보: 06년 6월 ~ 22년 7월
- 규모별 정보: 초소형, 소형, 중소형, 중대형, 대형
- 단위 정보: 만원/㎡
데이터 전처리 방향 - 1
- 행에는 데이트타임 > 열별로 규모별 정보 세분화
- 행정구역 정보로 네 개 데이터 분리
ex) 전국(df_nation) 데이터 예시
|
nano(초소형) |
micro(소형) |
small(중소형) |
medium(중대형) |
large(대형) |
2006.01 |
351.0 |
355.8 |
419.3 |
522.8 |
602.5 |
2006.02 |
406.9 |
399.1 |
451.2 |
548.1 |
727.2 |
데이터 전처리 방향 - 2
- 행에는 데이트타임 > 열별로 행정구역별 정보 세분화
- 규모별 정보로 다섯 개 데이터 분리
- 초소형 열: 0, 5, 10, 15
- 소형 열: 1, 6, 11, 16
- 중소형 열: 2, 7, 12, 17
- 중대형 열: 3, 8, 13, 18
- 대형 열: 4, 9, 14, 19
ex) micro(df_micro)
|
nation(전국) |
seoul(서울) |
capital(수도권) |
province(지방) |
2006.01 |
246.2 |
482.8 |
344.6 |
107.3 |
2006.02 |
195.4 |
398.1 |
282.0 |
107.0 |
긴 글 읽어주셔서 감사합니다 :)