Mehr als nur Accuracy
In dieser Übung bewertest du die AUC der ROC-Kurve für ein einfaches Entscheidungsbaum-Modell, um über die reine Accuracy hinauszugehen. Denk daran: Der Vergleichswert für einen zufälligen Klassifikator ist eine AUC von 0,5 – dein Ziel ist also, höher als 0,5 zu liegen.
X ist als DataFrame mit den Features verfügbar, und y ist als DataFrame mit den Zielwerten verfügbar. Sowohl sklearn als auch pandas als pd stehen dir in deinem Workspace zur Verfügung.
Mit diesem Setup betrachten wir die AUC unserer ROC-Kurve.
Diese Übung ist Teil des Kurses
CTR-Vorhersage mit Machine Learning in Python
Anleitung zur Übung
- Teile die Daten in Trainings- und Test-Set.
- Trainiere den Klassifikator mit den Trainingsdaten und erstelle Vorhersagen für die Testdaten mit
predict_proba()undpredict(). - Werte die AUC unter der ROC-Kurve mithilfe der Funktion
roc_curve()aufy_testaus, überroc_curve(y_test, y_score[:, 1]).
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Training and testing
X_train, X_test, y_train, y_test = \
____(X, y, test_size = .2, random_state = 0)
# Create decision tree classifier
clf = DecisionTreeClassifier()
# Train classifier - predict probability score and label
y_score = clf.fit(____, ____).predict_proba(____)
y_pred = clf.fit(____, ____).predict(____)
# Get ROC curve metrics
fpr, tpr, thresholds = ____(____, y_score[:, 1])
roc_auc = auc(fpr, tpr)
print(roc_auc)