728x90
반응형
안녕하세요 늑대양입니다 :)
계속해서 본격적으로 ML 학습을 진행합니다!! 🥸
[AI 데이터 사이언티스트 취업 완성 과정]의 46일차 일과를 정리하여 안내해드리도록 하겠습니다.
Day 46 시간표:
- 머신러닝 입문
- 워크시트 작성 및 제출
- 머신러닝 입문 (실강)
Day 46 온라인 학습 범위:
- 8강
- 예상 학습 시간: 2:54:36
대주제(Part) | 중주제(Chapter) |
Part.4 머신러닝 with Python | CH05_01. 클러스터링의 정의 |
Part.4 머신러닝 with Python | CH05_02. Model1. K-means |
Part.4 머신러닝 with Python | CH05_03. Model2. Hierarchical Agglomerative |
Part.4 머신러닝 with Python | CH05_04. Model3. DBSCAN |
Part.4 머신러닝 with Python | CH05_05. Model4. Spectral Clustering |
Part.4 머신러닝 with Python | CH05_06. Mini PJT. 쇼핑몰 사용자 고객 세분화 |
Part.4 머신러닝 with Python | CH06_01. Case1. 생산공정 테스트 시간 예측 |
Part.4 머신러닝 with Python | CH06_02. Case2. 지하철 이용 패턴 분석 |
머신러닝 입문
Decision Tree to Random Forest
Ensemble - Bagging
- Bagging: Bootstrap aggregation
- Bootstrapping > data sampling 기법
- 데이터를 N(원본 데이터 개수)개 뽑음
- With replacement (복원추출)
- 뽑은 것을 N개의 모델로 나눔
- N개에 대해서 majority voting(다수결 투표) 진행
- 동률일 경우엔 그 중에 랜덤 사용
Random Forest
Bagging + Randoum subspace method (Feature sampling)
- Bagging 되는 모델은 서로 완전히 독립적!!
- (이론상) 코어 당 하나씩 돌려볼 수 있음
- 조금 더 모델들이 다양하게 나옴
- Tree 하나 하나가 각각의 CART!!
Bagging > Random forest(믿음의 영역) > Boosting(R.F의 단점 극복) > Gradient Boosting(좋지만 매우 느림) > LightGBM(속도까지 개선!)
- 데이터가 적으면 Bagging, random forest를 활용하자!!
긴 글 읽어주셔서 감사합니다 :)
728x90
반응형
'AI > [부트캠프] 데이터 사이언티스트 과정' 카테고리의 다른 글
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 48. (0) | 2022.11.01 |
---|---|
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 47. (0) | 2022.10.31 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 45. (0) | 2022.10.27 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 44. (2) | 2022.10.26 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 43. (0) | 2022.10.25 |