Lazy Train-Test-Split
Du hast die X-Variablen transformiert. Jetzt musst du deine Datenaufbereitung abschließen, indem du die y-Variablen transformierst und deine Daten in Trainings- und Testdaten aufteilst.
Die Variablen X und y, die du in der letzten Übung erstellt hast, stehen in deiner Umgebung zur Verfügung.
Diese Übung ist Teil des Kurses
<Kurs>Parallele Programmierung mit Dask in Python</Kurs>Übungsanweisungen
- Importiere die Funktion
train_test_split()ausdask_ml.model_selection. - Die Popularitätswerte in
yliegen im Bereich 0–100. Teile sie durch 100, damit sie im Bereich 0–1 liegen. - Teile die Daten mit der Funktion
train_test_split()in Trainings- und Testdaten auf, stelle sicher, dass die Daten gemischt werden, und setze den Testanteil auf 20 % der Daten.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import the train_test_split function
from ____ import ____
# Rescale the target values
y = ____
# Split the data into train and test sets
X_train, X_test, y_train, y_test = ____
print(X_train)