# page 79 ~ 86 두 번째 머신러닝 프로그램: 이전에 만든 훈련 세트와 테스트 세트로 k-최근접 이웃 모델을 훈련시켜 봅시다. fit() 메서드를 실행할 때마다 KNeighborsClassifier 클래스의 객체는 이전에 학습한 모든 것을 잃어버립니다. 이전 모델을 그대로 두고 싶다면 KNeighborsClassifier 클래스 객체를 새로 만들어야 합니다. kn = kn.fit(train_input, train_target) kn.score(test_input, test_target) # 출력 결과물 1.0 100%의 정혹도로 테스트 세트에 있는 생성 확인 가능! predict() 메서드로 테스트 세트의 예측 결과와 실제 타깃 비교: kn.predict(test_input) # 출력 결과물 a..
# page 73 ~ 78 넘파이: "넘파이(numpy)는 파이썬의 대표적인 배열(array) 라이브러리입니다. 파이썬의 리스트로 2차원 리스트를 표현할 수 있지만 고차원 리스트를 표현하려면 매우 번거롭습니다. 넘파이는 고차원의 배열을 손쉽게 만들고 조작할 수 있는 간편한 도구를 많이 제공합니다. 차원(dimension)이란 말은 조금씩 다른 의미로 쓰일 수 있습니다. 배열에서 차원은 좌표계의 축과 같습니다. 1차원 배열은 선, 2차원 배열은 면, 3차원 배열은 공간을 나타냅니다. 보통의 xy 좌표계와는 달리 시작점이 왼쪽 아래가 아니고 왼쪽 위에서부터 시작합니다. "먼저 넘파이 라이브러리를 임포트합니다." "넘파이 array() 함수에 파이썬 리스트를 전달하면 끝입니다." import numpy as ..
# page 65 ~ 73 Chapter 02. 데이터 다루기: 핵심 키워드: 지도 학습 비지도 학습 훈련 세트 테스트 세트 지도 학습과 비지도 학습: "머신러닝 알고리즘은 크게 지도 학습(supervised learning)과 비지도 학습(unsupervised learning)으로 나눌 수 있습니다." "지도 학습에서는 데이터와 정답을 입력(input)과 타깃(target)이라고 하고, 이 둘을 합쳐 훈련 데이터(training data)라고 부릅니다." "그리고 앞서 언급했듯이 입력으로 사용된 길이와 무게를 특성(feature)이라고 합니다." "지도 학습은 정답(타깃)이 있으니 알고리즘이 정답을 맞히는 것을 학습합니다." "반면 비지도 학습 알고리즘은 타깃 없이 입력 데이터만 사용합니다." "머신..
# page 50 ~ 64 첫 번째 머신러닝 프로그램: "k-최근접 이웃(k-Nearest Neighbors)알고리즘을 사용해 도미와 빙어 데이터를 구분해보겠습니다." "앞에서 준비했던 빙어 데이터를 하나의 데이터로 합치겠습니다." length = bream_length + smelt_length weight = bream_weight + smelt_weight "패키지(사이킷런)를 사용하려면 각 특성의 리스트를 세로 방향으로 늘어뜨린 2차원 리스트를 만들어야 합니다." "이렇게 만드는 가장 쉬운 방법은 파이썬의 zip() 함수와 리스트 내포 구문을 사용하는 것입니다." zip() 함수는 나열된 리스트 각각에서 하나씩 원소를 꺼내 반환합니다. # zip()함수와 리스트 내포 구문 사용 fish_data ..