KNN auf skalierten Daten

Die Accuracy auf dem unskalierten wine-Datensatz war ordentlich, aber schauen wir mal, was du mit Standardisierung erreichen kannst. Wie zuvor wurden das knn-Modell sowie die Datensätze X und y mit Labels bereits für dich erstellt.

Diese Übung ist Teil des Kurses

<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Erzeuge die Methode StandardScaler() und speichere sie in einer Variablen namens scaler.
Skaliere die Trainings- und Testmerkmale, achte dabei darauf, keine data leakage zu verursachen.
Fitte das knn-Modell auf die skalierten Trainingsdaten.
Bewerte die Modellleistung, indem du die Accuracy auf dem Testset berechnest.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Instantiate a StandardScaler
scaler = ____

# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)

# Fit the k-nearest neighbors model to the training data
____.____(____, ____)

# Score the model on the test data
print(____.____(____, ____))

Code bearbeiten und ausführen