Das beste Modell auswählen
In dieser Übung vergleichst du verschiedene Klassifikatoren und wählst denjenigen aus, der am besten abschneidet.
Der Datensatz – bereits geladen und in Trainings- und Testdaten aufgeteilt – besteht aus Pokémon: ihren Werten, Typen und der Information, ob sie legendär sind oder nicht. Ziel unserer Klassifikatoren ist es, die Variable 'Legendary' vorherzusagen.
Drei einzelne Klassifikatoren wurden auf den Trainingsdaten trainiert:
clf_lrist eine logistische Regression.clf_dtist ein Entscheidungsbaum.clf_knnist ein 5-Nearest-Neighbors-Klassifikator.
Da die Klassen unausgewogen sind – nur 65 der 800 Pokémon im Datensatz sind legendär – verwenden wir den F1-Score zur Bewertung der Leistung. Scikit-learns f1_score() wurde bereits für dich importiert.
Diese Übung ist Teil des Kurses
Ensemble-Methoden in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Predict the labels of the test set
pred_lr = ____
pred_dt = ____
pred_knn = ____