Divisão em treinamento/teste + cálculo da precisão
É hora de praticar a divisão de dados em conjuntos de treinamento e teste usando o conjunto de dados churn_df
!
Foram criadas matrizes do NumPy para você, contendo as variáveis independentes como X
e a variável dependente como y
.
Este exercício faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Instruções do exercício
- Importe
train_test_split
desklearn.model_selection
. - Divida
X
ey
em conjuntos de treinamento e teste, definindotest_size
igual a 20%,random_state
igual a42
e garantindo que as proporções dos rótulos da variável dependente reflitam as do conjunto de dados original. - Ajuste o modelo
knn
aos dados de treinamento. - Calcule e imprima a precisão do modelo para os dados de teste.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the module
from ____ import ____
X = churn_df.drop("churn", axis=1).values
y = churn_df["churn"].values
# Split into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____, stratify=____)
knn = KNeighborsClassifier(n_neighbors=5)
# Fit the classifier to the training data
____
# Print the accuracy
print(knn.score(____, ____))