ComenzarEmpieza gratis

División train-test perezosa

Ya has transformado las variables X. Ahora tienes que terminar la preparación de los datos transformando las variables y y dividiendo tus datos en conjuntos de entrenamiento y prueba.

Las variables X e y, que creaste en el ejercicio anterior, están disponibles en tu entorno.

Este ejercicio forma parte del curso

Programación paralela con Dask en Python

Ver curso

Instrucciones del ejercicio

  • Importa la función train_test_split() de dask_ml.model_selection.
  • Las puntuaciones de popularidad en y están en el rango 0-100; divídelas entre 100 para que queden en el rango 0-1.
  • Divide los datos en conjuntos de entrenamiento y prueba usando la función train_test_split(), asegurándote de barajar los datos, y fija la fracción de prueba en el 20% de los datos.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import the train_test_split function
from ____ import ____

# Rescale the target values
y = ____

# Split the data into train and test sets
X_train, X_test, y_train, y_test = ____

print(X_train)
Editar y ejecutar código