Modellierung des UFO-Datensatzes, Teil 1

In dieser Übung baust du ein k-Nearest-Neighbor-Modell, das vorhersagt, in welchem Land die UFO-Sichtung stattgefunden hat. Der Datensatz X enthält die logarithmisch normalisierte Spaltenangabe zu Sekunden, die One-Hot-encodeten Typ-Spalten sowie den Monat und das Jahr der Sichtung. Die y-Labels sind die codierte Länderspalte, wobei 1 für "us" und 0 für "ca" steht.

Diese Übung ist Teil des Kurses

Vorverarbeitung für Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

Gib die .columns des X-Sets aus.
Teile die X- und y-Sets, sodass die Klassenverteilung der Labels in Trainings- und Testsets gleich ist, und verwende dabei random_state gleich 42.
Fitte knn auf die Trainingsdaten.
Gib die Testgenauigkeit des knn-Modells aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Take a look at the features in the X set of data
print(____)

# Split the X and y sets
X_train, X_test, y_train, y_test = ____

# Fit knn to the training sets
knn.____

# Print the score of knn on the test sets
print(____)

Code bearbeiten und ausführen