1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Introducere în Spark SQL în Python

Connected

Bài tập

Împarte datele

Ai la dispoziție un DataFrame df_examples cu coloanele endword: string, features: vector, outvec: vector și label: int. Vei împărți acest DataFrame pentru a obține un set de antrenament și un set de testare, pe care le vei folosi pentru a antrena și evalua un clasificator.

Hướng dẫn

100 XP
  • Împarte exemplele în seturi de antrenament și testare folosind un raport de 80/20.
  • Afișează numărul de exemple din setul de antrenament.
  • Afișează numărul de exemple din setul de testare.