KNN su dati scalati
L'accuracy sul dataset wine non scalato era discreta, ma vediamo cosa puoi ottenere usando la standardizzazione. Ancora una volta, il modello knn e gli insiemi di dati e etichette X e y sono già stati creati per te.
Questo esercizio fa parte del corso
Preprocessing per il Machine Learning in Python
Istruzioni dell'esercizio
- Crea il metodo
StandardScaler(), memorizzandolo in una variabile chiamatascaler. - Scala le feature di training e di test, facendo attenzione a non introdurre data leakage.
- Allena il modello
knnsui dati di training scalati. - Valuta le prestazioni del modello calcolando l'accuracy sul set di test.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Instantiate a StandardScaler
scaler = ____
# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)
# Fit the k-nearest neighbors model to the training data
____.____(____, ____)
# Score the model on the test data
print(____.____(____, ____))