LoslegenKostenlos starten

Lazy Train-Test-Split

Du hast die X-Variablen transformiert. Jetzt musst du deine Datenaufbereitung abschließen, indem du die y-Variablen transformierst und deine Daten in Trainings- und Testdaten aufteilst.

Die Variablen X und y, die du in der letzten Übung erstellt hast, stehen in deiner Umgebung zur Verfügung.

Diese Übung ist Teil des Kurses

<Kurs>Parallele Programmierung mit Dask in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Importiere die Funktion train_test_split() aus dask_ml.model_selection.
  • Die Popularitätswerte in y liegen im Bereich 0–100. Teile sie durch 100, damit sie im Bereich 0–1 liegen.
  • Teile die Daten mit der Funktion train_test_split() in Trainings- und Testdaten auf, stelle sicher, dass die Daten gemischt werden, und setze den Testanteil auf 20 % der Daten.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import the train_test_split function
from ____ import ____

# Rescale the target values
y = ____

# Split the data into train and test sets
X_train, X_test, y_train, y_test = ____

print(X_train)
Code bearbeiten und ausführen