Modellierung des UFO-Datensatzes, Teil 1
In dieser Übung baust du ein k-Nearest-Neighbor-Modell, das vorhersagt, in welchem Land die UFO-Sichtung stattgefunden hat. Der Datensatz X enthält die logarithmisch normalisierte Spaltenangabe zu Sekunden, die One-Hot-encodeten Typ-Spalten sowie den Monat und das Jahr der Sichtung. Die y-Labels sind die codierte Länderspalte, wobei 1 für "us" und 0 für "ca" steht.
Diese Übung ist Teil des Kurses
<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>Übungsanweisungen
- Gib die
.columnsdesX-Sets aus. - Teile die
X- undy-Sets, sodass die Klassenverteilung der Labels in Trainings- und Testsets gleich ist, und verwende dabeirandom_stategleich42. - Fitte
knnauf die Trainingsdaten. - Gib die Testgenauigkeit des
knn-Modells aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Take a look at the features in the X set of data
print(____)
# Split the X and y sets
X_train, X_test, y_train, y_test = ____
# Fit knn to the training sets
knn.____
# Print the score of knn on the test sets
print(____)