LoslegenKostenlos loslegen

KNN auf skalierten Daten

Die Accuracy auf dem unskalierten wine-Datensatz war ordentlich, aber schauen wir mal, was du mit Standardisierung erreichen kannst. Wie zuvor wurden das knn-Modell sowie die Datensätze X und y mit Labels bereits für dich erstellt.

Diese Übung ist Teil des Kurses

Vorverarbeitung für Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Erzeuge die Methode StandardScaler() und speichere sie in einer Variablen namens scaler.
  • Skaliere die Trainings- und Testmerkmale, achte dabei darauf, keine data leakage zu verursachen.
  • Fitte das knn-Modell auf die skalierten Trainingsdaten.
  • Bewerte die Modellleistung, indem du die Accuracy auf dem Testset berechnest.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Instantiate a StandardScaler
scaler = ____

# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)

# Fit the k-nearest neighbors model to the training data
____.____(____, ____)

# Score the model on the test data
print(____.____(____, ____))
Code bearbeiten und ausführen