KNN mit nicht skalierten Daten
Bevor du Standardisierung in deinen scikit-learn-Workflow einbaust, schaust du dir zuerst die Genauigkeit eines K-Nearest-Neighbors-Modells auf dem wine-Datensatz an – ohne die Daten zu standardisieren.
Das knn-Modell sowie die Daten- und Label-Sets X und y wurden bereits erstellt.
Diese Übung ist Teil des Kurses
<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>Übungsanweisungen
- Teile den Datensatz in Trainings- und Testsets auf.
- Fitte das
knn-Modell auf die Trainingsdaten. - Gib die Testgenauigkeit deines trainierten
knn-Modells aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Split the dataset and labels into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, stratify=y, random_state=42)
# Fit the k-nearest neighbors model to the training data
____
# Score the model on the test data
print(____.____(____, ____))