1. 학습
  2. /
  3. 강의
  4. /
  5. scikit-learn으로 배우는 Supervised Learning

Connected

연습 문제

과적합과 과소적합

모델 복잡도를 해석하는 것은 지도 학습 성능을 평가하는 훌륭한 방법입니다. 목표는 특성과 타깃 변수 간의 관계를 잘 파악하면서, 새로운 관측값에도 잘 일반화되는 모델을 만드는 것입니다.

churn_df 데이터셋에서 학습/테스트 세트가 생성되어 X_train, X_test, y_train, y_test로 미리 로드되어 있습니다.

또한 numpy는 np로, KNeighborsClassifier도 함께 임포트되어 있습니다.

지침

100 XP
  • neighbors를 1부터 12까지(포함)의 값으로 이루어진 numpy 배열로 생성하세요.
  • 이웃 수를 neighbor 이터레이터로 설정하여 KNeighborsClassifier를 인스턴스화하세요.
  • 모델을 학습 데이터에 맞춰 학습(fit)하세요.
  • .score() 메서드를 사용해 학습 세트와 테스트 세트의 정확도를 각각 계산하고, 결과를 train_accuracies와 test_accuracies 딕셔너리에 neighbor 이터레이터를 인덱스로 사용해 저장하세요.