Divisão train-test preguiçosa
Você já transformou as variáveis X. Agora, finalize a preparação dos dados transformando as variáveis y e dividindo seus dados em conjuntos de treino e teste.
As variáveis X e y, que você criou no último exercício, estão disponíveis no seu ambiente.
Este exercício faz parte do curso
Programação Paralela com Dask em Python
Instruções do exercício
- Importe a função
train_test_split()dedask_ml.model_selection. - As pontuações de popularidade em
yestão no intervalo de 0 a 100; divida-as por 100 para ficarem no intervalo de 0 a 1. - Divida os dados em conjuntos de treino e teste usando a função
train_test_split(), garantindo que os dados sejam embaralhados e definindo a fração de teste para 20% dos dados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the train_test_split function
from ____ import ____
# Rescale the target values
y = ____
# Split the data into train and test sets
X_train, X_test, y_train, y_test = ____
print(X_train)