Lazy Train-Test-Split
Du hast die X-Variablen transformiert. Jetzt musst du deine Datenaufbereitung abschließen, indem du die y-Variablen transformierst und deine Daten in Trainings- und Testdaten aufteilst.
Die Variablen X und y, die du in der letzten Übung erstellt hast, stehen in deiner Umgebung zur Verfügung.
Diese Übung ist Teil des Kurses
Parallele Programmierung mit Dask in Python
Anleitung zur Übung
- Importiere die Funktion
train_test_split()ausdask_ml.model_selection. - Die Popularitätswerte in
yliegen im Bereich 0–100. Teile sie durch 100, damit sie im Bereich 0–1 liegen. - Teile die Daten mit der Funktion
train_test_split()in Trainings- und Testdaten auf, stelle sicher, dass die Daten gemischt werden, und setze den Testanteil auf 20 % der Daten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the train_test_split function
from ____ import ____
# Rescale the target values
y = ____
# Split the data into train and test sets
X_train, X_test, y_train, y_test = ____
print(X_train)