1. Apprendre
  2. /
  3. Cours
  4. /
  5. Apprentissage supervisé avec scikit-learn

Connected

Exercice

Surapprentissage et sous-apprentissage

Interpréter la complexité d'un modèle est une excellente façon d'évaluer la performance en apprentissage supervisé. Votre objectif est de produire un modèle qui sache capter la relation entre les caractéristiques et la variable cible, tout en généralisant bien à de nouvelles observations.

Les ensembles d'entraînement et de test ont été créés à partir du jeu de données churn_df et préchargés sous les noms X_train, X_test, y_train et y_test.

De plus, KNeighborsClassifier a été importé pour vous, ainsi que numpy sous le nom np.

Instructions

100 XP
  • Créez neighbors comme un tableau numpy de valeurs allant de 1 jusqu'à 12 inclus.
  • Instanciez un KNeighborsClassifier en fixant le nombre de voisins à la valeur de l'itérateur neighbor.
  • Ajustez le modèle aux données d'entraînement.
  • Calculez séparément les scores d'exactitude pour l'ensemble d'entraînement et l'ensemble de test avec la méthode .score(), puis assignez les résultats aux dictionnaires train_accuracies et test_accuracies, respectivement, en utilisant l'itérateur neighbor comme indice.