728x90
반응형
안녕하세요 늑대양입니다 :)
계속해서 본격적으로 ML 학습을 진행합니다!! 🥸
[AI 데이터 사이언티스트 취업 완성 과정]의 48일차 일과를 정리하여 안내해드리도록 하겠습니다.
Day 48 시간표:
- 머신러닝 실전 (실강)
- 머신러닝 실전
머신러닝 실전 (실강)
Learning material:
실습 진행
sklearn_tutorial_Spaceship_Titanic_Prediction_Tutorial
이론 수업
회귀(Regression)
데이터의 경향성을 파악!
- 회귀의 (비교적) 엄밀한 정의 (Formal Definition)
"In statistical modeling, regression analysis is a set of statistical processes for estimating the relationships betwwen a dependent variable(y) and one or more independent variables(X).
- linear regression
- Gradient Boosting model
회귀의 직관적인 의미
- 주어진 데이터(X)와 원하는 값(y) 사이의 관계를 찾는 방법
- 주어진 데이터(X)를 통해서 원하는 값(y = target value)을 예측하는 방법
e.g. 부동산 매물 관련된 여러 가지 데이터(X)가 주어졌을 때, 집 값(y)을 예측하는 작업
Linear regression
가장 직관적인 회귀 모델
Linear regression의 장점!
- 해석력이 아주 좋음!!
- 오히려 심플하게 하는 것이 더 예측이 잘 될 수도 있음(조금 버리는 부분이 있다 하더라도..)
- 학습 속도도 빠름!
- 기타 등등
Nonlinear 한 방법의 단점
- Overfitting 될 가능성이 높음
- 해석이 어려움
딥러닝에서 Linear regression 사용 이유
- 지도가 없어서..🫠
머신러닝에서 Linear regression 사용 이유
- 정답을 빨리 찾고 싶어서
- 부호 보다는 업데이트 된다는 느낌적인 느낌이 중요함!!!
Gradient Boosting model
Boosting
Gradient Boosting
Decision Tree model - Regression Tree
- 10개 보다 적으면 버려버림!!
Gradient Boosting Model - Random Forest + Gradient Descent Algorithm
- Regularization을 정말 잘해줘야함!! (overfitting을 막기위함!!)
- residual(잔류) 의 r
- XGBoost는 속도까지 (
개)쩜!!
긴 글 읽어주셔서 감사합니다 😍
728x90
반응형
'AI > [부트캠프] 데이터 사이언티스트 과정' 카테고리의 다른 글
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 50. (0) | 2022.11.03 |
---|---|
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 49. (0) | 2022.11.02 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 47. (0) | 2022.10.31 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 46. (0) | 2022.10.28 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 45. (0) | 2022.10.27 |