1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ Spark SQL 入門

Connected

演習

データを分割する

データフレーム df_examples が用意されています。列は endword: string、features: vector、outvec: vector、label: int です。これを学習用とテスト用に分割し、分類器の学習と評価に使います。

指示

100 XP
  • 例を 80/20 の割合で学習用とテスト用に分割します。
  • 学習用データの件数を出力します。
  • テスト用データの件数を出力します。