KNN mit nicht skalierten Daten
Bevor du Standardisierung in deinen scikit-learn-Workflow einbaust, schaust du dir zuerst die Genauigkeit eines K-Nearest-Neighbors-Modells auf dem wine-Datensatz an – ohne die Daten zu standardisieren.
Das knn-Modell sowie die Daten- und Label-Sets X und y wurden bereits erstellt.
Diese Übung ist Teil des Kurses
Vorverarbeitung für Machine Learning in Python
Anleitung zur Übung
- Teile den Datensatz in Trainings- und Testsets auf.
- Fitte das
knn-Modell auf die Trainingsdaten. - Gib die Testgenauigkeit deines trainierten
knn-Modells aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Split the dataset and labels into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, stratify=y, random_state=42)
# Fit the k-nearest neighbors model to the training data
____
# Score the model on the test data
print(____.____(____, ____))