1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySpark入門

Connected

演習

データを分割する

ここまでで前処理は完了しました。モデリングの前の最後のステップとして、データを分割しましょう。

指示

100 XP
  • DataFrame メソッド .randomSplit() を使って、piped_data を 2 つに分割します。リスト [.6, .4] を .randomSplit() に渡し、データの 60% を含む training と、40% を含む test に分けてください。