728x90
반응형
안녕하세요 늑대양입니다.
본격적으로 모델링 프로젝트를 2주간 진행합니다 🥸
(추가적으로 시간이 날 때마다, 데이터 엔지니어링 인강을 수강하고 있습니다)
오늘은 [AI 데이터 사이언티스트 취업 완성 과정]의 57일차 일과를 정리하여 안내해드리도록 하겠습니다.
Day 57 시간표:
- 머신러닝 (강의 복습)
- 미니 프로젝트: 모델링
머신러닝 (강의 복습)
Chapter.03 Classification-01. 분류의 정의
분류(classification): 주어진 데이터(X)를 분류하고자 하는 값(y)에 할당하는 방법
Definition (from Wiki)
“Applications in which the training data comprises examples of the input vectors along with their corresponding target vectors are known as supervised learning problems. Cases in which the aim is to assign each input vector to one of a finite number of discrete categories, are called classification problems.”
- 분류란, 주어진 input data를 찾고자 하는 target value에 assign하는 것을 말합니다.
- Input data는 일반적으로 vector이며, (feature vector)
Target value는 일반적으로 scalar입니다. (integer) - 비슷한 특징을 가지는 데이터가 같은 분류로 나뉘어지는 것은 서로 상대적으로 가까운 feature vector들이 같은 target value를 부여받는 것입니다.
- 예를 들어, 고양이와 강아지 사진이 섞여있는 2000장의 이미지가 있다고 칩시다. (고양이 사진이 1000장, 강아지 사진이 1000장입니다.)
- 위의 애니메이션처럼, 고양이 사진을 머신러닝 모델이 판단해서 “CAT”이라고 label을 부여합니다.
- 여기서 라벨은 0 또는 1로 표기하는 것이 일반적입니다.
e.g. Cat(0), Dog(1) - 주어진 이미지는 feature vector로 표현이 됩니다.
- 머신러닝 분류 모델을 거치면, inference 결과로 0 또는 1이 나오도록 하는 문제를 “binary classification” 이라고 합니다.
- 위의 2000장은 모두 label이 이미 있어야 하며(supervised manner) 해당 label을 통해서 inference 결과가 맞았는지 아닌지를 확인할 수 있습니다.
- 이 때 머신러닝 분류 모델에는 다음과 같은 모델들이 있습니다.
- Classification Model (Bold: 다루는 내용)
- Linear Classifier
- Logistic Regression
- Naive Bayes
- KNN
- SVM
- Random Forest
- Neural Network
미니프로젝트: 모델링
긴 글 읽어주셔서 감사합니다 😆
728x90
반응형
'AI > [부트캠프] 데이터 사이언티스트 과정' 카테고리의 다른 글
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 59. (0) | 2022.11.16 |
---|---|
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 58. (0) | 2022.11.15 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 56. (0) | 2022.11.11 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 55. (0) | 2022.11.10 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 54. (0) | 2022.11.09 |