1. Learn
  2. /
  3. 课程
  4. /
  5. Python 中的 Spark SQL 入门

Connected

道练习

划分数据

已提供一个 dataframe df_examples,包含列 endword:string、features:vector、outvec:vector,以及 label:int。您将把它划分为训练集和测试集,用于训练并测试一个分类器。

说明

100 XP
  • 按 80/20 比例将样本划分为训练集和测试集。
  • 打印训练样本数量。
  • 打印测试样本数量。