1. Учиться
  2. /
  3. Courses
  4. /
  5. scikit-learn で学ぶ Supervised Learning

Connected

Exercise

過学習と過小適合

モデルの複雑さを解釈することは、教師あり学習の性能を評価するうえで非常に有効です。目的は、特徴量と目的変数の関係を捉えられ、かつ新しい観測にも汎化できるモデルを作ることです。

churn_df データセットから作成した訓練セットとテストセットは、すでに X_train、X_test、y_train、y_test として読み込まれています。

さらに、KNeighborsClassifier と、numpy は np としてインポート済みです。

Инструкции

100 XP
  • 1 から 12(両端を含む)までの値を持つ numpy 配列として neighbors を作成します。
  • 近傍数を neighbor イテレータに等しくして、KNeighborsClassifier をインスタンス化します。
  • モデルを訓練データにフィットさせます。
  • .score() メソッドを使って、訓練セットとテストセットの正解率をそれぞれ計算し、結果を辞書 train_accuracies と test_accuracies に、インデックスとして neighbor イテレータを用いて格納します。