Standard-Thresholding
Du möchtest bestätigen, dass der DecisionTreeClassifier() denselben Standard-Schwellenwert für die Klassifikation verwendet wie in der vorherigen Lektion erwähnt, nämlich 0,5. Es erscheint dir merkwürdig, dass alle Klassifikatoren denselben Schwellenwert verwenden. Lass uns das prüfen! Ein trainierter Entscheidungsbaum-Klassifikator clf wurde bereits für dich geladen, ebenso wie die Trainings- und Testdaten mit ihren üblichen Namen: X_train, X_test, y_train und y_test. Du musst die Wahrscheinlichkeiten mit der Methode .predict_proba() aus dem Klassifikator extrahieren.
Diese Übung ist Teil des Kurses
Machine-Learning-Workflows in Python entwerfen
Anleitung zur Übung
- Erzeuge Scores für die Testbeispiele mit dem vorab geladenen Klassifikator
clf. - Extrahiere jetzt Labels aus den Scores. Denk daran: Du hast für jedes Beispiel ein Paar von Scores, nicht nur einen einzelnen, und das zweite Element ist die Wahrscheinlichkeit der positiven Klasse.
- Vergib nun Labels für die Testdaten mit der Standardmethode
.predict(). - Vergleiche schließlich mit den Vorhersagen von zuvor. Sind sie identisch?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Score the test data using the given classifier
scores = clf.____(____)
# Get labels from the scores using the default threshold
preds = [s[____] > ____ for s in scores]
# Use the predict method to label the test data again
preds_default = clf.____(____)
# Compare the two sets of predictions
____(preds == preds_default)