KNN sur données mises à l’échelle

Le score de précision obtenu sur le jeu de données wine non standardisé était correct, mais voyons ce que vous pouvez obtenir grâce à la standardisation. Une fois encore, le modèle knn ainsi que les données et étiquettes X et y ont déjà été préparés pour vous.

Cet exercice fait partie du cours

Prétraitement pour le Machine Learning en Python

Afficher le cours

Instructions

Créez l’objet StandardScaler(), stocké dans une variable appelée scaler.
Mettez à l’échelle les variables d’entraînement et de test, en veillant à ne pas introduire de data leakage.
Ajustez le modèle knn sur les données d’entraînement mises à l’échelle.
Évaluez les performances du modèle en calculant la précision sur l’ensemble de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Instantiate a StandardScaler
scaler = ____

# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)

# Fit the k-nearest neighbors model to the training data
____.____(____, ____)

# Score the model on the test data
print(____.____(____, ____))

Modifier et exécuter le code