새소식

반응형
AI/[부트캠프] 데이터 사이언티스트 과정

[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 36.

  • -
728x90
반응형

 

 

 

 

안녕하세요 늑대양입니다 :)

 

 

이번 주와 다음 주 초까지 EDA 프로젝트가 진행됩니다!! 🤓

 

 

오늘은 [AI 데이터 사이언티스트 취업 완성 과정]의 36일차 일과를 정리하여 안내해드리도록 하겠습니다.

 

 

 

늑대양 연두 연두 버전!

 

 

 

 

Day 36 시간표:

  • 미니 프로젝트: EDA
  • 미니 프로젝트: EDA

 

 

미니 프로젝트: EDA

담당 데이터 확인

아파트 규모별 매매 실거래 평균가격

Data URL: https://kosis.kr/statHtml/statHtml.do?orgId=408&tblId=DT_KAB_11672_S19&vw_cd=&list_id=00000168&scrId=&seqNo=&lang_mode=ko&obj_var_id=&itm_id=&conn_path=R1&path=

 

KOSIS

 

kosis.kr

 

 

 

샘플 데이터

 

 

데이터 정보 요약:

  • 행정구역 정보: 전국, 서울, 수도권, 지방
  • 시점 정보: 06년 6월 ~ 22년 7월
  • 규모별 정보: 초소형, 소형, 중소형, 중대형, 대형
  • 단위 정보: 만원/㎡
 
 
데이터 전처리 방향 - 1
  • 행에는 데이트타임 > 열별로 규모별 정보 세분화
  • 행정구역 정보로 네 개 데이터 분리

 

ex) 전국(df_nation) 데이터 예시
  nano(초소형) micro(소형) small(중소형) medium(중대형) large(대형)
2006.01 351.0 355.8 419.3 522.8 602.5
2006.02 406.9 399.1 451.2 548.1 727.2

 

 

 

데이터 전처리 방향 - 2
  • 행에는 데이트타임 > 열별로 행정구역별 정보 세분화
  • 규모별 정보로 다섯 개 데이터 분리
    • 초소형 열: 0, 5, 10, 15
    • 소형 열: 1, 6, 11, 16
    • 중소형 열: 2, 7, 12, 17
    • 중대형 열: 3, 8, 13, 18
    • 대형 열: 4, 9, 14, 19

 

ex) micro(df_micro)

  nation(전국) seoul(서울) capital(수도권) province(지방)
2006.01 246.2 482.8 344.6 107.3
2006.02 195.4 398.1 282.0 107.0

 

 

 

 

 

 

 

 

 

 

 

긴 글 읽어주셔서 감사합니다 :)

 

 

 

 

 

 

728x90
반응형
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.