Model maken met de UFO-gegevensset, deel 1

In deze oefening bouw je een k-nearest neighbors-model om te voorspellen in welk land de UFO-waarneming plaatsvond. De X-gegevensset bevat de log-genormaliseerde kolom met seconden, de one-hot gecodeerde typekolommen, en de maand en het jaar waarin de waarneming plaatsvond. De y-labels zijn de gecodeerde landkolom, waarbij 1 staat voor "us" en 0 voor "ca".

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Cursus bekijken

Oefeninstructies

Print de .columns van de X-set.
Splits de X- en y-sets, zorg ervoor dat de klassenverdeling van de labels gelijk is in de train- en testsets, en gebruik een random_state van 42.
Fit knn op de trainingsdata.
Print de nauwkeurigheid op de testset van het knn-model.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Take a look at the features in the X set of data
print(____)

# Split the X and y sets
X_train, X_test, y_train, y_test = ____

# Fit knn to the training sets
knn.____

# Print the score of knn on the test sets
print(____)

Code bewerken en uitvoeren