Suddivisione train-test pigra
Hai già trasformato le variabili X. Ora completa la preparazione dei dati trasformando le variabili y e suddividendo i dati in insiemi di training e test.
Le variabili X e y, che hai creato nell'esercizio precedente, sono disponibili nel tuo ambiente.
Questo esercizio fa parte del corso
Programmazione parallela con Dask in Python
Istruzioni dell'esercizio
- Importa la funzione
train_test_split()dadask_ml.model_selection. - I punteggi di popolarità in
ysono nell'intervallo 0-100, dividili per 100 così da portarli nell'intervallo 0-1. - Suddividi i dati in insiemi di training e test usando la funzione
train_test_split(), assicurati di mescolare i dati e imposta la frazione di test al 20% dei dati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the train_test_split function
from ____ import ____
# Rescale the target values
y = ____
# Split the data into train and test sets
X_train, X_test, y_train, y_test = ____
print(X_train)