Precision und Recall
Sowohl Precision als auch Recall beziehen sich auf die vier Ergebnisse aus der vorherigen Lektion und sind wichtige Bewertungsmetriken für jedes Machine-Learning-Modell. Ein CTR‑Modell für Anzeigen sollte idealerweise eine hohe Precision (hoher ROI beim Werbebudget) und einen hohen Recall (relevantes Zielgruppen-Targeting) haben. Obwohl man Precision und Recall per Hand berechnen kann, bietet sklearn praktische Implementierungen, die du leicht in den bestehenden Workflow einbauen kannst. In dieser Übung richtest du einen Entscheidungsbaum ein und berechnest Precision und Recall.
Das pandas‑Modul steht dir als pd zur Verfügung und der Beispiel‑DataFrame ist als df geladen. Die Features sind in X und das Target ist in y geladen. Zudem stehen precision_score() und recall_score() aus sklearn.metrics bereit.
Diese Übung ist Teil des Kurses
CTR-Vorhersage mit Machine Learning in Python
Anleitung zur Übung
- Erzeuge die Trainings‑ und Test‑Splits für
Xundy. - Definiere einen Decision‑Tree‑Classifier und erzeuge Vorhersagen
y_pred, indem du das Modell trainierst. - Verwende die Implementierungen aus
sklearn, um die Precision‑ und Recall‑Werte zu berechnen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set up training and testing split
X_train, X_test, y_train, y_test = ____(
____, ____, test_size = .2, random_state = 0)
# Create classifier and make predictions
clf = ____
y_pred = clf.____(____, _____).____(X_test)
# Evaluate precision and recall
prec = ____(y_test, ____, average = 'weighted')
recall = ____(y_test, ____, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))