Erste SchritteKostenlos loslegen

Berechnung der Konfusionsmatrix

Eine Konfusionsmatrix (gelegentlich auch Konfusionstabelle genannt) ist die Grundlage aller Leistungskennzahlen für Modelle mit einer kategorialen Antwort (wie z. B. eine logistische Regression). Sie enthält die Anzahl jedes Paares aus tatsächlicher Antwort und vorhergesagter Antwort. In diesem Fall, in dem es zwei mögliche Antworten gibt (abwandern oder nicht abwandern), gibt es vier Gesamtergebnisse.

  1. Echt positiv: Der Kunde hat sich abgewandt und das Modell hat es vorhergesagt.
  2. Falsch positiv: Der Kunde hat sich nicht abgewandt, aber das Modell hat es vorhergesagt.
  3. Richtig negativ: Der Kunde ist nicht abgewandert und das Modell hat das auch nicht vorhergesagt.
  4. Falsches Negativ: Der Kunde hat sich abgewandt, aber das Modell hat das nicht vorhergesagt.

churn und mdl_churn_vs_relationship sind verfügbar.

Diese Übung ist Teil des Kurses

Einführung in die Regression mit statsmodels in Python

Kurs anzeigen

Anleitung zur Übung

  • Erhalte die tatsächlichen Antworten, indem du die Spalte has_churned des Datensatzes unterteilst. Weise dies actual_response zu.
  • Erhalte die "wahrscheinlichsten" vorhergesagten Antworten aus dem Modell. Weise dies predicted_response zu.
  • Erstelle einen DataFrame aus actual_response und predicted_response. Weise dies outcomes zu.
  • Drucke outcomes als Tabelle mit Zählungen, die die Konfusionsmatrix darstellen. Das haben wir für dich getan.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Get the actual responses
actual_response = ____

# Get the predicted responses
predicted_response = ____

# Create outcomes as a DataFrame of both Series
outcomes = pd.DataFrame({____,
                         ____})

# Print the outcomes
print(outcomes.value_counts(sort = False))
Bearbeiten und Ausführen von Code