1. Nauka
  2. /
  3. Kursy
  4. /
  5. Programowanie równoległe z Dask w Pythonie

Connected

ćwiczenie

Leniwy podział na zbiór treningowy i testowy

Zmienne X zostały już przetworzone. Teraz trzeba dokończyć przygotowanie danych – przetworzyć zmienne y i podzielić dane na zbiór treningowy i testowy.

Zmienne X i y, utworzone w poprzednim ćwiczeniu, są dostępne w twoim środowisku.

Instrukcje

100 XP
  • Zaimportuj funkcję train_test_split() z dask_ml.model_selection.
  • Wyniki popularności w y mieszczą się w zakresie 0–100 – podziel je przez 100, aby uzyskać zakres 0–1.
  • Podziel dane na zbiór treningowy i testowy za pomocą funkcji train_test_split(), pamiętając o przetasowaniu danych i ustawieniu frakcji testowej na 20%.