Modellare l'insieme di dati sugli UFO, parte 1

In questo esercizio costruirai un modello k-nearest neighbors per prevedere in quale paese è avvenuto l'avvistamento UFO. L'insieme di dati X contiene la colonna dei secondi con scala log-normale, le colonne del tipo codificate one-hot, oltre al mese e all'anno in cui è avvenuto l'avvistamento. Le etichette y sono la colonna del paese codificata, dove 1 corrisponde a "us" e 0 a "ca".

Questo esercizio fa parte del corso

Preprocessing per il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

Stampa le .columns dell'insieme X.
Suddividi gli insiemi X e y, assicurandoti che la distribuzione delle classi delle etichette sia la stessa nei set di training e di test, e usa random_state pari a 42.
Esegui il fit di knn sui dati di training.
Stampa l'accuratezza sul set di test del modello knn.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Take a look at the features in the X set of data
print(____)

# Split the X and y sets
X_train, X_test, y_train, y_test = ____

# Fit knn to the training sets
knn.____

# Print the score of knn on the test sets
print(____)

Modifica ed esegui il codice