1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Spark SQL w Pythonie

Connected

ćwiczenie

Podziel dane

Dostępna jest ramka danych df_examples z kolumnami: endword (string), features (wektor), outvec (wektor) oraz label (int). Podzielisz ją na zbiór treningowy i testowy, których użyjesz do trenowania i oceny klasyfikatora.

Instrukcje

100 XP
  • Podziel przykłady na zbiór treningowy i testowy w proporcji 80/20.
  • Wyświetl liczbę przykładów treningowych.
  • Wyświetl liczbę przykładów testowych.