IniziaInizia gratis

KNN su dati scalati

L'accuracy sul dataset wine non scalato era discreta, ma vediamo cosa puoi ottenere usando la standardizzazione. Ancora una volta, il modello knn e gli insiemi di dati e etichette X e y sono già stati creati per te.

Questo esercizio fa parte del corso

Preprocessing per il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea il metodo StandardScaler(), memorizzandolo in una variabile chiamata scaler.
  • Scala le feature di training e di test, facendo attenzione a non introdurre data leakage.
  • Allena il modello knn sui dati di training scalati.
  • Valuta le prestazioni del modello calcolando l'accuracy sul set di test.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Instantiate a StandardScaler
scaler = ____

# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)

# Fit the k-nearest neighbors model to the training data
____.____(____, ____)

# Score the model on the test data
print(____.____(____, ____))
Modifica ed esegui il codice