ComeçarComece de graça

Divisão train-test preguiçosa

Você já transformou as variáveis X. Agora, finalize a preparação dos dados transformando as variáveis y e dividindo seus dados em conjuntos de treino e teste.

As variáveis X e y, que você criou no último exercício, estão disponíveis no seu ambiente.

Este exercício faz parte do curso

Programação Paralela com Dask em Python

Ver curso

Instruções do exercício

  • Importe a função train_test_split() de dask_ml.model_selection.
  • As pontuações de popularidade em y estão no intervalo de 0 a 100; divida-as por 100 para ficarem no intervalo de 0 a 1.
  • Divida os dados em conjuntos de treino e teste usando a função train_test_split(), garantindo que os dados sejam embaralhados e definindo a fração de teste para 20% dos dados.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import the train_test_split function
from ____ import ____

# Rescale the target values
y = ____

# Split the data into train and test sets
X_train, X_test, y_train, y_test = ____

print(X_train)
Editar e executar o código