CommencerCommencer gratuitement

KNN sur données mises à l’échelle

Le score de précision obtenu sur le jeu de données wine non standardisé était correct, mais voyons ce que vous pouvez obtenir grâce à la standardisation. Une fois encore, le modèle knn ainsi que les données et étiquettes X et y ont déjà été préparés pour vous.

Cet exercice fait partie du cours

Prétraitement pour le Machine Learning en Python

Afficher le cours

Instructions

  • Créez l’objet StandardScaler(), stocké dans une variable appelée scaler.
  • Mettez à l’échelle les variables d’entraînement et de test, en veillant à ne pas introduire de data leakage.
  • Ajustez le modèle knn sur les données d’entraînement mises à l’échelle.
  • Évaluez les performances du modèle en calculant la précision sur l’ensemble de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Instantiate a StandardScaler
scaler = ____

# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)

# Fit the k-nearest neighbors model to the training data
____.____(____, ____)

# Score the model on the test data
print(____.____(____, ____))
Modifier et exécuter le code