1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Parallel Programming with Dask in Python

Connected

cvičení

Líné rozdělení na trénovací a testovací sadu

Proměnné X už máš transformované. Teď je potřeba dokončit přípravu dat – transformovat proměnné y a rozdělit data na trénovací a testovací sadu.

Proměnné X a y, které jsi vytvořil/a v předchozím cvičení, jsou dostupné v tvém prostředí.

Pokyny

100 XP
  • Importuj funkci train_test_split() z dask_ml.model_selection.
  • Skóre popularity v y jsou v rozsahu 0–100 – vydel je 100, aby byly v rozsahu 0–1.
  • Rozděl data na trénovací a testovací sadu pomocí funkce train_test_split(), nezapomeň data promíchat a nastav podíl testovací sady na 20 % dat.