Modellierung des UFO-Datensatzes, Teil 1
In dieser Übung baust du ein k-Nearest-Neighbor-Modell, das vorhersagt, in welchem Land die UFO-Sichtung stattgefunden hat. Der Datensatz X enthält die logarithmisch normalisierte Spaltenangabe zu Sekunden, die One-Hot-encodeten Typ-Spalten sowie den Monat und das Jahr der Sichtung. Die y-Labels sind die codierte Länderspalte, wobei 1 für "us" und 0 für "ca" steht.
Diese Übung ist Teil des Kurses
Vorverarbeitung für Machine Learning in Python
Anleitung zur Übung
- Gib die
.columnsdesX-Sets aus. - Teile die
X- undy-Sets, sodass die Klassenverteilung der Labels in Trainings- und Testsets gleich ist, und verwende dabeirandom_stategleich42. - Fitte
knnauf die Trainingsdaten. - Gib die Testgenauigkeit des
knn-Modells aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Take a look at the features in the X set of data
print(____)
# Split the X and y sets
X_train, X_test, y_train, y_test = ____
# Fit knn to the training sets
knn.____
# Print the score of knn on the test sets
print(____)