1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn で学ぶ Supervised Learning

Connected

演習

分類モデルの性能を可視化する

この演習では、music_df データセットの "popularity" 列を二値化しています。"popularity" 列の中央値以上を表す場合は 1、中央値未満の場合は 0 です。

あなたのタスクは、曲が人気かどうかを分類するために、3種類のモデルを構築し、その結果を可視化することです。

データはすでに分割・スケーリング済みで、X_train_scaled、X_test_scaled、y_train、y_test として読み込まれています。さらに、KNeighborsClassifier、DecisionTreeClassifier、LogisticRegression がインポート済みです。

指示

100 XP
  • "Logistic Regression"、"KNN"、"Decision Tree Classifier" をキーとする辞書を作成し、各キーの値にそれぞれのモデル呼び出しを設定します。
  • models の値をループ処理します。
  • 分割数を 6、shuffle を True、random_state を 12 に設定して、KFold オブジェクトをインスタンス化します。
  • モデル、スケーリング済みの学習用特徴量、目的変数の学習データを用い、cv に kf を指定してクロスバリデーションを実行します。