KNN su dati scalati

L'accuracy sul dataset wine non scalato era discreta, ma vediamo cosa puoi ottenere usando la standardizzazione. Ancora una volta, il modello knn e gli insiemi di dati e etichette X e y sono già stati creati per te.

Questo esercizio fa parte del corso

Preprocessing per il Machine Learning in Python

Visualizza corso

Istruzioni dell'esercizio

Crea il metodo StandardScaler(), memorizzandolo in una variabile chiamata scaler.
Scala le feature di training e di test, facendo attenzione a non introdurre data leakage.
Allena il modello knn sui dati di training scalati.
Valuta le prestazioni del modello calcolando l'accuracy sul set di test.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Instantiate a StandardScaler
scaler = ____

# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)

# Fit the k-nearest neighbors model to the training data
____.____(____, ____)

# Score the model on the test data
print(____.____(____, ____))

Modifica ed esegui il codice