KNN sur données mises à l’échelle
Le score de précision obtenu sur le jeu de données wine non standardisé était correct, mais voyons ce que vous pouvez obtenir grâce à la standardisation. Une fois encore, le modèle knn ainsi que les données et étiquettes X et y ont déjà été préparés pour vous.
Cet exercice fait partie du cours
Prétraitement pour le Machine Learning en Python
Instructions
- Créez l’objet
StandardScaler(), stocké dans une variable appeléescaler. - Mettez à l’échelle les variables d’entraînement et de test, en veillant à ne pas introduire de data leakage.
- Ajustez le modèle
knnsur les données d’entraînement mises à l’échelle. - Évaluez les performances du modèle en calculant la précision sur l’ensemble de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Instantiate a StandardScaler
scaler = ____
# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)
# Fit the k-nearest neighbors model to the training data
____.____(____, ____)
# Score the model on the test data
print(____.____(____, ____))