Model maken met de UFO-gegevensset, deel 1
In deze oefening bouw je een k-nearest neighbors-model om te voorspellen in welk land de UFO-waarneming plaatsvond. De X-gegevensset bevat de log-genormaliseerde kolom met seconden, de one-hot gecodeerde typekolommen, en de maand en het jaar waarin de waarneming plaatsvond. De y-labels zijn de gecodeerde landkolom, waarbij 1 staat voor "us" en 0 voor "ca".
Deze oefening maakt deel uit van de cursus
Preprocessing voor Machine Learning in Python
Oefeninstructies
- Print de
.columnsvan deX-set. - Splits de
X- eny-sets, zorg ervoor dat de klassenverdeling van de labels gelijk is in de train- en testsets, en gebruik eenrandom_statevan42. - Fit
knnop de trainingsdata. - Print de nauwkeurigheid op de testset van het
knn-model.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Take a look at the features in the X set of data
print(____)
# Split the X and y sets
X_train, X_test, y_train, y_test = ____
# Fit knn to the training sets
knn.____
# Print the score of knn on the test sets
print(____)