CommencerCommencer gratuitement

Séparation apprentissage/test et calcul de la précision

Il est temps de vous entraîner à diviser vos données en ensembles d’apprentissage et de test avec l’ensemble de données churn_df.

Des tableaux NumPy ont été créés pour vous, contenant les caractéristiques nommées X et la cible nommée y.

Cet exercice fait partie du cours

Apprentissage supervisé avec scikit-learn

Afficher le cours

Instructions

  • Importez train_test_split à partir de sklearn.model_selection.
  • Divisez X et y en ensembles d’apprentissage et de test, en fixant test_size à 20 %, random_state à 42, et en veillant à ce que les proportions d’étiquettes cibles reflètent celles de l’ensemble de données d’origine.
  • Ajustez le modèle knn aux données d’apprentissage.
  • Calculez et affichez la précision du modèle pour les données de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the module
from ____ import ____

X = churn_df.drop("churn", axis=1).values
y = churn_df["churn"].values

# Split into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____, stratify=____)
knn = KNeighborsClassifier(n_neighbors=5)

# Fit the classifier to the training data
____

# Print the accuracy
print(knn.score(____, ____))
Modifier et exécuter le code