Séparation apprentissage/test et calcul de la précision
Il est temps de vous entraîner à diviser vos données en ensembles d’apprentissage et de test avec l’ensemble de données churn_df
.
Des tableaux NumPy ont été créés pour vous, contenant les caractéristiques nommées X
et la cible nommée y
.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions
- Importez
train_test_split
à partir desklearn.model_selection
. - Divisez
X
ety
en ensembles d’apprentissage et de test, en fixanttest_size
à 20 %,random_state
à42
, et en veillant à ce que les proportions d’étiquettes cibles reflètent celles de l’ensemble de données d’origine. - Ajustez le modèle
knn
aux données d’apprentissage. - Calculez et affichez la précision du modèle pour les données de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the module
from ____ import ____
X = churn_df.drop("churn", axis=1).values
y = churn_df["churn"].values
# Split into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____, stratify=____)
knn = KNeighborsClassifier(n_neighbors=5)
# Fit the classifier to the training data
____
# Print the accuracy
print(knn.score(____, ____))