1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn による教師あり学習

Connected

演習

訓練データ/テストデータの分割と精度の計算

churn_df データセットを使って、データを訓練セットとテストセットに分割する練習をしましょう。

特徴量を格納した X と目的変数を格納した y という NumPy 配列はあらかじめ用意されています。

指示

100 XP
  • train_test_split から sklearn.model_selection をインポートします。
  • X を 20%、y を test_size に設定し、元のデータセットの目的変数のラベル比率が反映されるように、random_state と 42 を訓練セットとテストセットに分割します。
  • knn モデルを訓練データに適合させます。
  • テストデータに対するモデルの精度を計算して出力します。