1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn による教師あり学習

Connected

演習

分類モデルの性能の可視化

この演習では、分類問題に取り組みます。"popularity" データセットの music_df 列は、1 列の中央値以上の場合は "popularity"、中央値未満の場合は 0 となる二値に変換されています。

3つの異なるモデルを構築し、楽曲が人気かどうかを分類した結果を可視化しましょう。

データはあらかじめ分割・スケーリングされており、X_train_scaled、X_test_scaled、y_train、y_test として読み込まれています。また、KNeighborsClassifier、DecisionTreeClassifier、LogisticRegression はすでにインポートされています。

指示

100 XP
  • "Logistic Regression"、"KNN"、"Decision Tree Classifier" をキーとする辞書を作成し、それぞれの値に各モデルの呼び出しを設定しましょう。
  • models の値をループ処理しましょう。
  • KFold オブジェクトをインスタンス化して6分割を実行する設定にし、shuffle を True、random_state を 12 に設定しましょう。
  • モデル、スケーリング済みの訓練用特徴量、訓練用ターゲットを使用し、cv を kf に設定して交差検証を実行しましょう。