728x90
반응형
안녕하세요 늑대양입니다.
날씨가 다시 풀렸네요!! 좋은 가을 날씨입니다 🍂
[AI 데이터 사이언티스트 취업 완성 과정]의 52일차 일과를 정리하여 안내해드리도록 하겠습니다.
Day 52 시간표:
- 머신러닝 실전
- 머신러닝 실전 (실강)
머신러닝 실전
클러스터링(Clustering)
- 비슷한 데이터끼리 묶는 방법
- 클러스터링의 (비교적) 엄밀한 정의 (Formal Definition)
"Cluster analysis or clustering is the task of grouping a set of objects in such a way that objects in the same group (called a cluster) are more similar (in some sense) to each other than to those in other gorups (clusters)."
- 비지도학습 문제 (Y가 없다!)
- 특정 패턴을 찾는 것을 목표로 함!
- Unsupervised classification
- 중요 포인트!
- Data representation (feature vector)
- Similarity measure (distance function을 자주 활용)
News Clustering
- ex) 비슷한 내용의 뉴스 기사 그룹화하기
K-Means Clustering
가장 직관적이고 이해하기 쉬운 클러스터링 방법!
- 클러스터링 방법 중에 가장 대표적인 방법
- "K-평균 알고리즘"이라고도 부르며, 평균(mean)을 기준으로 데이터들을 묶어줌
- 엄청나게 빠른 속도로 수행되며, 결과가 무조건 나온다는 것이 보장!! (수렴성)
Process
- 랜덤하게 K개의 데이터를 선택하여 기준으로 정한다.
- 선택하지 않은 모든 데이터에 대해서 선택한 K개의 데이터 중 가장 가까운 데이터를 찾는다.
- 가깝다고 정해진 데이터끼리 묶어서 새로운 클러스터를 만든다.
- 새롭게 구성된 클러스터에 속하는 데이터들의 평균을 구한다.
- 새로 계산한 평균을 새로운 K개의 기준으로 정한다.
- 2번 과정 부터 다시 반복한다.
- 새롭게 업데이트 되는 데이터가 없다면 동료한다.
<<< 작업 중 >>>
긴 글 읽어주셔서 감사합니다 😍
728x90
반응형
'AI > [부트캠프] 데이터 사이언티스트 과정' 카테고리의 다른 글
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 54. (0) | 2022.11.09 |
---|---|
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 53. (0) | 2022.11.08 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 51. (0) | 2022.11.04 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 50. (0) | 2022.11.03 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 49. (0) | 2022.11.02 |