LoslegenKostenlos loslegen

Das beste Modell auswählen

In dieser Übung vergleichst du verschiedene Klassifikatoren und wählst denjenigen aus, der am besten abschneidet.

Der Datensatz – bereits geladen und in Trainings- und Testdaten aufgeteilt – besteht aus Pokémon: ihren Werten, Typen und der Information, ob sie legendär sind oder nicht. Ziel unserer Klassifikatoren ist es, die Variable 'Legendary' vorherzusagen.

Drei einzelne Klassifikatoren wurden auf den Trainingsdaten trainiert:

  • clf_lr ist eine logistische Regression.
  • clf_dt ist ein Entscheidungsbaum.
  • clf_knn ist ein 5-Nearest-Neighbors-Klassifikator.

Da die Klassen unausgewogen sind – nur 65 der 800 Pokémon im Datensatz sind legendär – verwenden wir den F1-Score zur Bewertung der Leistung. Scikit-learns f1_score() wurde bereits für dich importiert.

Diese Übung ist Teil des Kurses

Ensemble-Methoden in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Predict the labels of the test set
pred_lr = ____
pred_dt = ____
pred_knn = ____
Code bearbeiten und ausführen