LoslegenKostenlos loslegen

Lazy Train-Test-Split

Du hast die X-Variablen transformiert. Jetzt musst du deine Datenaufbereitung abschließen, indem du die y-Variablen transformierst und deine Daten in Trainings- und Testdaten aufteilst.

Die Variablen X und y, die du in der letzten Übung erstellt hast, stehen in deiner Umgebung zur Verfügung.

Diese Übung ist Teil des Kurses

Parallele Programmierung mit Dask in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere die Funktion train_test_split() aus dask_ml.model_selection.
  • Die Popularitätswerte in y liegen im Bereich 0–100. Teile sie durch 100, damit sie im Bereich 0–1 liegen.
  • Teile die Daten mit der Funktion train_test_split() in Trainings- und Testdaten auf, stelle sicher, dass die Daten gemischt werden, und setze den Testanteil auf 20 % der Daten.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the train_test_split function
from ____ import ____

# Rescale the target values
y = ____

# Split the data into train and test sets
X_train, X_test, y_train, y_test = ____

print(X_train)
Code bearbeiten und ausführen