KNN sur des données non mises à l’échelle
Avant d’ajouter une standardisation à votre workflow scikit-learn, vous allez d’abord examiner la précision d’un modèle des K plus proches voisins sur le jeu de données wine sans standardiser les données.
Le modèle knn, ainsi que les ensembles de données et d’étiquettes X et y, ont déjà été créés.
Cet exercice fait partie du cours
Prétraitement pour le Machine Learning en Python
Instructions
- Séparez le jeu de données en ensembles d’entraînement et de test.
- Ajustez le modèle
knnsur les données d’entraînement. - Affichez la précision sur le jeu de test de votre modèle
knnentraîné.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Split the dataset and labels into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, stratify=y, random_state=42)
# Fit the k-nearest neighbors model to the training data
____
# Score the model on the test data
print(____.____(____, ____))