KNN auf skalierten Daten
Die Accuracy auf dem unskalierten wine-Datensatz war ordentlich, aber schauen wir mal, was du mit Standardisierung erreichen kannst. Wie zuvor wurden das knn-Modell sowie die Datensätze X und y mit Labels bereits für dich erstellt.
Diese Übung ist Teil des Kurses
Vorverarbeitung für Machine Learning in Python
Anleitung zur Übung
- Erzeuge die Methode
StandardScaler()und speichere sie in einer Variablen namensscaler. - Skaliere die Trainings- und Testmerkmale, achte dabei darauf, keine data leakage zu verursachen.
- Fitte das
knn-Modell auf die skalierten Trainingsdaten. - Bewerte die Modellleistung, indem du die Accuracy auf dem Testset berechnest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Instantiate a StandardScaler
scaler = ____
# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)
# Fit the k-nearest neighbors model to the training data
____.____(____, ____)
# Score the model on the test data
print(____.____(____, ____))