1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶDaskによる並列プログラミング

Connected

演習

遅延評価での学習用・テスト用分割

X 変数の変換は完了しています。次は、y 変数を変換し、データを学習用とテスト用に分割して前処理を仕上げます。

前の演習で作成した変数 X と y は、すでにあなたの環境に用意されています。

指示

100 XP
  • dask_ml.model_selection から train_test_split() 関数をインポートします。
  • y の人気度スコアは 0〜100 の範囲なので、100 で割って 0〜1 の範囲に正規化します。
  • train_test_split() 関数を使ってデータを学習用とテスト用に分割します。データをシャッフルし、テストデータの割合を 20% に設定してください。