1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do Spark SQL v Pythonu

Connected

cvičení

Rozdělení dat

K dispozici máš dataframe df_examples se sloupci endword (řetězec), features (vektor), outvec (vektor) a label (celé číslo). Rozdělíš ho na trénovací a testovací sadu, které použiješ k natrénování a otestování klasifikátoru.

Pokyny

100 XP
  • Rozděl příklady na trénovací a testovací sadu v poměru 80/20.
  • Vypiš počet trénovacích příkladů.
  • Vypiš počet testovacích příkladů.