División train-test perezosa
Ya has transformado las variables X. Ahora tienes que terminar la preparación de los datos transformando las variables y y dividiendo tus datos en conjuntos de entrenamiento y prueba.
Las variables X e y, que creaste en el ejercicio anterior, están disponibles en tu entorno.
Este ejercicio forma parte del curso
Programación paralela con Dask en Python
Instrucciones del ejercicio
- Importa la función
train_test_split()dedask_ml.model_selection. - Las puntuaciones de popularidad en
yestán en el rango 0-100; divídelas entre 100 para que queden en el rango 0-1. - Divide los datos en conjuntos de entrenamiento y prueba usando la función
train_test_split(), asegurándote de barajar los datos, y fija la fracción de prueba en el 20% de los datos.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the train_test_split function
from ____ import ____
# Rescale the target values
y = ____
# Split the data into train and test sets
X_train, X_test, y_train, y_test = ____
print(X_train)