1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 금융 분야 Machine Learning

Connected

연습 문제

KNN 성능 평가

방금 KNN 점수에서 몇 가지를 확인했어요. 우선 학습 점수는 처음에 높았다가 n이 커질수록 감소했는데, 이는 일반적입니다. 반면 테스트 세트 성능은 n=5에서 정점에 도달했고, 최종 KNN 모델의 설정으로 그 값을 사용하겠습니다.

이제 여러 번 해 본 것처럼 시각적으로 성능을 확인해 보겠습니다. 이렇게 하면 실제 값의 구간별로 모델이 얼마나 잘 예측하는지 볼 수 있어요. 먼저 스케일링된 피처에 대해 knn 모델의 .predict() 메서드로 예측값을 구합니다. 그런 다음 matplotlib의 plt.scatter()를 사용해 실제 값과 예측 값을 산점도로 나타내겠습니다.

지침

100 XP
  • KNeighborsRegressor의 n_neighbors를 이전 연습 문제에서 찾은 최적 값인 5로 설정하세요.
  • scaled_train_features와 scaled_test_features에 대해 knn 모델로 예측값을 구하세요.
  • test_targets와 test_predictions의 산점도를 만들고 레이블을 test로 지정하세요.