1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn による教師あり学習

Connected

演習

過学習と未学習

モデルの複雑さを解釈することは、教師あり学習のパフォーマンスを評価する上で重要な手法です。目標は、特徴量と目的変数の関係を正確に捉えつつ、未知のデータにもうまく汎化できるモデルを構築することです。

訓練セットとテストセットは churn_df データセットから作成済みで、X_train、X_test、y_train、y_test としてあらかじめ読み込まれています。

また、KNeighborsClassifier と numpy(np)もインポート済みです。

指示

100 XP
  • neighbors から numpy までの値(両端を含む)がある1配列として12 を作成します。
  • KNeighborsClassifierイテレータの値を近傍数として指定し、neighborをインスタンス化します。
  • モデルを訓練データに適合させます。
  • .score()メソッドを使って訓練セットとテストセットそれぞれの精度を計算し、train_accuraciesイテレータをインデックスとして用いてtest_accuraciesとneighborに格納します。