728x90
반응형
안녕하세요 늑대양입니다 :)
오늘은 [AI 데이터 사이언티스트 취업 완성 과정]의 26일차 일과를 정리하여 안내해드리도록 하겠습니다.
![](https://t1.daumcdn.net/keditor/emoticon/friends1/large/001.gif)
Day 26 시간표:
- 온라인 학습: 파이썬 라이브러리 기초
- 실시간 강의: 파이썬 라이브러리 기초
Day 26. 온라인 학습 범위:
- 16강
- 예상 학습 시간: 3:35:05
중주제(Chapter) | 소주제(Clip) |
Part 4. Python 기초 | CH03_01. 데이터 프레임 생성 |
Part 4. Python 기초 | CH03_02. 칼럼명 추출 변경 |
Part 4. Python 기초 | CH03_03. copy를 이용한 데이터 복사 |
Part 4. Python 기초 | CH03_04. 시리즈 |
Part 4. Python 기초 | CH03_05. loc과 iloc을 이용한 원하는 위치의 데이터 추출 |
Part 4. Python 기초 | CH03_06. 조건에 맞는 데이터 추출 |
Part 4. Python 기초 | CH03_07. 정렬 |
Part 4. Python 기초 | CH03_08. 결측값 처리 |
Part 4. Python 기초 | CH03_09. 타입 변환 |
Part 4. Python 기초 | CH03_10. 레코드, 칼럼 추가 삭제 |
Part 4. Python 기초 | CH03_11. apply.map을 활용한 데이터 변환 |
Part 4. Python 기초 | CH03_12. 데이터프레임 결합_상하결합 |
Part 4. Python 기초 | CH03_13. 데이터 프레임 결합_좌우결합 |
Part 4. Python 기초 | CH03_14. 그룹화 |
Part 4. Python 기초 | CH03_15. 피벗테이블 |
Part 4. Python 기초 | CH03_16. 파일호출_저장 |
한 번에 끝내는 데이터 분석 초격차 패키지 Online.
- 박범* 강사님 진행
- (현)Wadiz 데이터 사이언티스트
- (전)xiilab 인공지능개발팀 선임연구원
- MATLAB으로 시작하는 프로그래밍(Inflearn, 구름 EDU)
- MATLAB 처럼 쓰는 PYTHON(Inflearn, 구름 EDU)
- jupyter notebook 으로 시작하는 python(Inflearn, 구름 EDU)
- 도란도란 데이터 네트워킹 파티 2019
- 커리어 변신 데이터 분석가
- 데이터야 놀자 2020
- 데이터로 대화하는 재미
- 리틀 빅 데이터 컨퍼런스 2020
- 같이 달리자, 데이터 하니 등
Part4. Python 기초
CH01_인트로
CH01_01. 과정 소개
파이썬:
- 장점: 간결함
- 강의 목적: 데이터 분석 (raw 데이터를 정재 > 가시화)
- 기초 문법 학습 > 다양한 라이브러리 학습(시각화 라이브러리, 나아가서 텐서 등)
- 수식 X, 수학적, 통계적 내용은 다루지 않을 것
- 10시간 정도 학습 예정 (현업에서 필요한 기본 베이스 내용을 다룰 예정)
- 무설치 진행 (코랩을 통해 강의 진행 예정)
- 진행 방식 (단계별로 쌓아나가는 방식)
CH01_02. colab 소개
- 구글 코랩 사용
- 브라우저에서 파이썬 이용 가능
- 더블클릭 또는 Enter 키를 눌러 수정
- 코드 셀: 코드를 입력하고 실행하는 셀
- 텍스트 셀: 텍스트, 이미지, 수식 등을 입력하는 셀
- 마크다운 지원
- Latex 문법을 통한 수식 작성 지원
CH02_파이썬 기초
CH02_01. 파이썬의 특징
CH02_02. 변수
CH02_03. 자료형_숫자형
CH02_04. 자료형_문자형
CH02_05. 자료형_리스트
CH02_06. 자료형_튜플
CH02_07. 자료형_딕셔너리
CH02_08. 자료형_셋
CH02_09. 제어문_for
CH02_10. 제어문_while
CH02_11. 제어문_if
CH02_12. List Comprehension
CH02_13. 함수
CH02_14. 외부 라이브러리 사용
데이터분석을 위한 선형대수학
데이터를 벡터로 이해하기
Contents
- 데이터분석과 선형대수
- 벡터란 무엇인가?
- 데이터 분석을 위한 벡터 연산
- Feature Space
1. 데이터 분석과 선형대수
데이터 분석 예시
- 6번 고객과 가장 비슷한 고객을 어떻게 찾을 것인가?
- 어떤 기준으로 고객의 유사성을 판단할 것인가?
- 데이터는 벡터다!!
2. 벡터란 무엇인가?
벡터의 정의
- 벡터 공간의 원소
- 여러 개의 숫자 모음
- 여러 개의 숫자를 묶어서 표현! | e.g v = (1, 2, 3)
- 숫자 묶음을 하나의 개념으로 정의함 | e.g 학생 한 명 = (175, 70, 4.1)
벡터와 공간에 대한 이해
- 축(axis): 벡터의 원소의 의미
- 차원(dimension): 벡터의 원소 개수
- 벡터 공강의 원소(element): 벡터
- 벡터 공간(Vector Space): 벡터들의 집합
- 크기(norm): 벡터의 길이
- 방향(direction: 단위 벡터(unit vector)
데이터 분석 예시
- 다음 주어진 데이터를 벡터로 표현한다면 기준은 무엇으로 잡을까?
- 다음 주어진 데이터는 몇 차원 벡터일까?
- 데이터의 Product_Info_2 열의 경우엔 공간에 어떻게 표현되는가?
3. 데이터 분석을 위한 벡터 연산
데이터의 특징을 파악할 수 있는 기본 연산
N 차원의 벡터에 대해, 아래의 연산이 가능!
- 벡터의 크기 (a.k.a L2 Norm)
- 벡터의 덧셈/뺄셈
- 스칼라 배
- 벡터의 내적
벡터 간 거리
데이터 사이의 유사성 측정
- N 차원 벡터 x, y에 대해 측정 가능
- Manhattan Distance (L1 distance)
- Euclidean Distance (L2 distance)
- Cosine Distance = 1 -(x o y) / |x|*|y|
- 기하학적 표현
데이터 분석 예시
- d(v6, v16) = sqrt(0.005^2 + 8^2 + 2^2)
4. Feature Space
Feature Space의 정의
- 주어진 데이터의 특징을 정의한 벡터 공간
- 주어진 데이터를 Input vector 라고 할 때, input vector 중에 필요한 특징만을 추출(또는 선별)하여 벡터로 표현한 것을 "feature vector" 라고 한다.
- 필요한 특징을 선별하는 방법은 데이터를 잘 이해하고 있는 분석가가 담당
- 필요한 특징을 추출하는 방법은 차원 축소 모델을 사용
데이터 분석 예시
- 학습을 통하여 새로운 Feature vector를 생성하는 경우 (e.g. embedding)
- text embedding model = Language Model
728x90
반응형
'AI > [부트캠프] 데이터 사이언티스트 과정' 카테고리의 다른 글
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 28. (0) | 2022.09.30 |
---|---|
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 27. (2) | 2022.09.29 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 25. (0) | 2022.09.27 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 24. (2) | 2022.09.26 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 23. (2) | 2022.09.23 |