Modellierung des UFO-Datensatzes, Teil 1

In dieser Übung baust du ein k-Nearest-Neighbor-Modell, das vorhersagt, in welchem Land die UFO-Sichtung stattgefunden hat. Der Datensatz X enthält die logarithmisch normalisierte Spaltenangabe zu Sekunden, die One-Hot-encodeten Typ-Spalten sowie den Monat und das Jahr der Sichtung. Die y-Labels sind die codierte Länderspalte, wobei 1 für "us" und 0 für "ca" steht.

Diese Übung ist Teil des Kurses

<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Gib die .columns des X-Sets aus.
Teile die X- und y-Sets, sodass die Klassenverteilung der Labels in Trainings- und Testsets gleich ist, und verwende dabei random_state gleich 42.
Fitte knn auf die Trainingsdaten.
Gib die Testgenauigkeit des knn-Modells aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Take a look at the features in the X set of data
print(____)

# Split the X and y sets
X_train, X_test, y_train, y_test = ____

# Fit knn to the training sets
knn.____

# Print the score of knn on the test sets
print(____)

Code bearbeiten und ausführen