LoslegenKostenlos loslegen

Standard-Thresholding

Du möchtest bestätigen, dass der DecisionTreeClassifier() denselben Standard-Schwellenwert für die Klassifikation verwendet wie in der vorherigen Lektion erwähnt, nämlich 0,5. Es erscheint dir merkwürdig, dass alle Klassifikatoren denselben Schwellenwert verwenden. Lass uns das prüfen! Ein trainierter Entscheidungsbaum-Klassifikator clf wurde bereits für dich geladen, ebenso wie die Trainings- und Testdaten mit ihren üblichen Namen: X_train, X_test, y_train und y_test. Du musst die Wahrscheinlichkeiten mit der Methode .predict_proba() aus dem Klassifikator extrahieren.

Diese Übung ist Teil des Kurses

Machine-Learning-Workflows in Python entwerfen

Kurs anzeigen

Anleitung zur Übung

  • Erzeuge Scores für die Testbeispiele mit dem vorab geladenen Klassifikator clf.
  • Extrahiere jetzt Labels aus den Scores. Denk daran: Du hast für jedes Beispiel ein Paar von Scores, nicht nur einen einzelnen, und das zweite Element ist die Wahrscheinlichkeit der positiven Klasse.
  • Vergib nun Labels für die Testdaten mit der Standardmethode .predict().
  • Vergleiche schließlich mit den Vorhersagen von zuvor. Sind sie identisch?

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Score the test data using the given classifier
scores = clf.____(____)

# Get labels from the scores using the default threshold
preds = [s[____] > ____ for s in scores]

# Use the predict method to label the test data again
preds_default = clf.____(____)

# Compare the two sets of predictions
____(preds == preds_default)
Code bearbeiten und ausführen