Berechnung der Konfusionsmatrix
Eine Konfusionsmatrix (gelegentlich auch Konfusionstabelle genannt) ist die Grundlage aller Leistungskennzahlen für Modelle mit einer kategorialen Antwort (wie z. B. eine logistische Regression). Sie enthält die Anzahl jedes Paares aus tatsächlicher Antwort und vorhergesagter Antwort. In diesem Fall, in dem es zwei mögliche Antworten gibt (abwandern oder nicht abwandern), gibt es vier Gesamtergebnisse.
- Echt positiv: Der Kunde hat sich abgewandt und das Modell hat es vorhergesagt.
- Falsch positiv: Der Kunde hat sich nicht abgewandt, aber das Modell hat es vorhergesagt.
- Richtig negativ: Der Kunde ist nicht abgewandert und das Modell hat das auch nicht vorhergesagt.
- Falsches Negativ: Der Kunde hat sich abgewandt, aber das Modell hat das nicht vorhergesagt.
churn
und mdl_churn_vs_relationship
sind verfügbar.
Diese Übung ist Teil des Kurses
Einführung in die Regression mit statsmodels in Python
Anleitung zur Übung
- Erhalte die tatsächlichen Antworten, indem du die Spalte
has_churned
des Datensatzes unterteilst. Weise diesactual_response
zu. - Erhalte die "wahrscheinlichsten" vorhergesagten Antworten aus dem Modell. Weise dies
predicted_response
zu. - Erstelle einen DataFrame aus
actual_response
undpredicted_response
. Weise diesoutcomes
zu. - Drucke
outcomes
als Tabelle mit Zählungen, die die Konfusionsmatrix darstellen. Das haben wir für dich getan.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Get the actual responses
actual_response = ____
# Get the predicted responses
predicted_response = ____
# Create outcomes as a DataFrame of both Series
outcomes = pd.DataFrame({____,
____})
# Print the outcomes
print(outcomes.value_counts(sort = False))