LoslegenKostenlos loslegen

Die Konfusionsmatrix berechnen

Eine Konfusionsmatrix (auch Verwechslungsmatrix genannt) ist die Grundlage aller Performancemetriken für Modelle mit kategorialer Zielvariable (wie der logistischen Regression). Sie enthält die Anzahlen jeder Kombination aus tatsächlicher und vorhergesagter Antwort. In diesem Fall, mit zwei möglichen Antworten (Kündigung oder keine Kündigung), gibt es vier Gesamtergebnisse.

  1. True Positive: Der Kunde hat gekündigt und das Modell hat eine Kündigung vorhergesagt.
  2. False Positive: Der Kunde hat nicht gekündigt, aber das Modell hat eine Kündigung vorhergesagt.
  3. True Negative: Der Kunde hat nicht gekündigt und das Modell hat keine Kündigung vorhergesagt.
  4. False Negative: Der Kunde hat gekündigt, aber das Modell hat keine Kündigung vorhergesagt.

churn und mdl_churn_vs_relationship sind verfügbar.

Diese Übung ist Teil des Kurses

Einführung in Regression mit statsmodels in Python

Kurs anzeigen

Anleitung zur Übung

  • Hole die tatsächlichen Antworten, indem du die Spalte has_churned des Datensatzes subsettest. Weise sie actual_response zu.
  • Hole die „wahrscheinlichsten“ vorhergesagten Antworten aus dem Modell. Weise sie predicted_response zu.
  • Erstelle aus actual_response und predicted_response ein DataFrame. Weise es outcomes zu.
  • Gib outcomes als Tabelle mit Häufigkeiten aus, die die Konfusionsmatrix darstellt. Das wurde bereits für dich erledigt.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Get the actual responses
actual_response = ____

# Get the predicted responses
predicted_response = ____

# Create outcomes as a DataFrame of both Series
outcomes = pd.DataFrame({____,
                         ____})

# Print the outcomes
print(outcomes.value_counts(sort = False))
Code bearbeiten und ausführen