ComeçarComece de graça

Divisão em treinamento/teste + cálculo da precisão

É hora de praticar a divisão de dados em conjuntos de treinamento e teste usando o conjunto de dados churn_df!

Foram criadas matrizes do NumPy para você, contendo as variáveis independentes como X e a variável dependente como y.

Este exercício faz parte do curso

Aprendizado Supervisionado com o scikit-learn

Ver curso

Instruções do exercício

  • Importe train_test_split de sklearn.model_selection.
  • Divida X e y em conjuntos de treinamento e teste, definindo test_size igual a 20%, random_state igual a 42 e garantindo que as proporções dos rótulos da variável dependente reflitam as do conjunto de dados original.
  • Ajuste o modelo knn aos dados de treinamento.
  • Calcule e imprima a precisão do modelo para os dados de teste.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import the module
from ____ import ____

X = churn_df.drop("churn", axis=1).values
y = churn_df["churn"].values

# Split into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____, stratify=____)
knn = KNeighborsClassifier(n_neighbors=5)

# Fit the classifier to the training data
____

# Print the accuracy
print(knn.score(____, ____))
Editar e executar o código