LoslegenKostenlos loslegen

Mehr als nur Accuracy

In dieser Übung bewertest du die AUC der ROC-Kurve für ein einfaches Entscheidungsbaum-Modell, um über die reine Accuracy hinauszugehen. Denk daran: Der Vergleichswert für einen zufälligen Klassifikator ist eine AUC von 0,5 – dein Ziel ist also, höher als 0,5 zu liegen.

X ist als DataFrame mit den Features verfügbar, und y ist als DataFrame mit den Zielwerten verfügbar. Sowohl sklearn als auch pandas als pd stehen dir in deinem Workspace zur Verfügung.

Mit diesem Setup betrachten wir die AUC unserer ROC-Kurve.

Diese Übung ist Teil des Kurses

CTR-Vorhersage mit Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Teile die Daten in Trainings- und Test-Set.
  • Trainiere den Klassifikator mit den Trainingsdaten und erstelle Vorhersagen für die Testdaten mit predict_proba() und predict().
  • Werte die AUC unter der ROC-Kurve mithilfe der Funktion roc_curve() auf y_test aus, über roc_curve(y_test, y_score[:, 1]).

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Training and testing
X_train, X_test, y_train, y_test = \
	____(X, y, test_size = .2, random_state = 0)

# Create decision tree classifier
clf = DecisionTreeClassifier()

# Train classifier - predict probability score and label
y_score = clf.fit(____, ____).predict_proba(____) 
y_pred = clf.fit(____, ____).predict(____) 

# Get ROC curve metrics
fpr, tpr, thresholds = ____(____, y_score[:, 1])
roc_auc = auc(fpr, tpr)
print(roc_auc)
Code bearbeiten und ausführen