LoslegenKostenlos loslegen

Vier Kategorien auswerten

Die Konfusionsmatrix ist das einfachste Werkzeug, um die vier Ergebnis-Kategorien zu betrachten: True Positives (TP), False Positives (FP), True Negatives (TN) und False Negatives (FN). In dieser Übung verwendest du einen Standard-Entscheidungsbaum-Klassifikator DecisionTreeClassifier() aus sklearn auf den Beispiel-Klickdaten und berechnest die Aufteilung der Ergebnisse in die vier Kategorien.

Das pandas-Modul ist als pd in deinem Workspace verfügbar und der Beispiel-DataFrame ist als df geladen. Die Features sind in X geladen und das Ziel in y. Außerdem steht DecisionTreeClassifier aus sklearn.tree zur Verfügung.

Diese Übung ist Teil des Kurses

CTR-Vorhersage mit Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Erzeuge die Trainings- und Testsplits für X und y.
  • Definiere einen Entscheidungsbaum-Klassifikator und erzeuge Vorhersagen y_pred, indem du das Modell fitst.
  • Verwende die Konfusionsmatrix, um die Anzahlen für die Kategorien jedes Ergebnisses zu erhalten, wobei 1 ein Positiv (Klick) und 0 ein Negativ (kein Klick) ist.
  • Zum Beispiel: Wahre Negative sind [0,0] und wahre Positive sind [1,1].

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Set up classifier using training data to predict test data
X_train, X_test, y_train, y_test = ____(
  X, y, test_size = .2, random_state = 0)
clf = ____
y_pred = clf.____(X_train, y_train).____(X_test) 

# Define confusion matrix and four categories
conf_matrix = ____(y_test, y_pred)
tn = conf_matrix[____][____]
fp = conf_matrix[____][____]
fn = conf_matrix[____][____]
tp = conf_matrix[____][____]

print("TN: %s, FP: %s, FN: %s, TP: %s" %(tn, fp, fn, tp))
Code bearbeiten und ausführen