Séparation apprentissage/test et calcul de la précision
Il est temps de vous entraîner à diviser vos données en ensembles d’apprentissage et de test avec l’ensemble de données churn_df.
Des tableaux NumPy ont été créés pour vous, contenant les caractéristiques nommées X et la cible nommée y.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions
- Importez
train_test_splità partir desklearn.model_selection. - Divisez
Xetyen ensembles d’apprentissage et de test, en fixanttest_sizeà 20 %,random_stateà42, et en veillant à ce que les proportions d’étiquettes cibles reflètent celles de l’ensemble de données d’origine. - Ajustez le modèle
knnaux données d’apprentissage. - Calculez et affichez la précision du modèle pour les données de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the module
from ____ import ____
X = churn_df.drop("churn", axis=1).values
y = churn_df["churn"].values
# Split into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____, stratify=____)
knn = KNeighborsClassifier(n_neighbors=5)
# Fit the classifier to the training data
____
# Print the accuracy
print(knn.score(____, ____))