1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Pythonで学ぶ Spark SQL 入門

Connected

अभ्यास

データを分割する

データフレーム df_examples が用意されています。列は endword: string、features: vector、outvec: vector、label: int です。これを学習用とテスト用に分割し、分類器の学習と評価に使います。

निर्देश

100 XP
  • 例を 80/20 の割合で学習用とテスト用に分割します。
  • 学習用データの件数を出力します。
  • テスト用データの件数を出力します。