Modellare l'insieme di dati sugli UFO, parte 1
In questo esercizio costruirai un modello k-nearest neighbors per prevedere in quale paese è avvenuto l'avvistamento UFO. L'insieme di dati X contiene la colonna dei secondi con scala log-normale, le colonne del tipo codificate one-hot, oltre al mese e all'anno in cui è avvenuto l'avvistamento. Le etichette y sono la colonna del paese codificata, dove 1 corrisponde a "us" e 0 a "ca".
Questo esercizio fa parte del corso
Preprocessing per il Machine Learning in Python
Istruzioni dell'esercizio
- Stampa le
.columnsdell'insiemeX. - Suddividi gli insiemi
Xey, assicurandoti che la distribuzione delle classi delle etichette sia la stessa nei set di training e di test, e usarandom_statepari a42. - Esegui il fit di
knnsui dati di training. - Stampa l'accuratezza sul set di test del modello
knn.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Take a look at the features in the X set of data
print(____)
# Split the X and y sets
X_train, X_test, y_train, y_test = ____
# Fit knn to the training sets
knn.____
# Print the score of knn on the test sets
print(____)