Die Konfusionsmatrix berechnen
Eine Konfusionsmatrix (auch Verwechslungsmatrix genannt) ist die Grundlage aller Performancemetriken für Modelle mit kategorialer Zielvariable (wie der logistischen Regression). Sie enthält die Anzahlen jeder Kombination aus tatsächlicher und vorhergesagter Antwort. In diesem Fall, mit zwei möglichen Antworten (Kündigung oder keine Kündigung), gibt es vier Gesamtergebnisse.
- True Positive: Der Kunde hat gekündigt und das Modell hat eine Kündigung vorhergesagt.
- False Positive: Der Kunde hat nicht gekündigt, aber das Modell hat eine Kündigung vorhergesagt.
- True Negative: Der Kunde hat nicht gekündigt und das Modell hat keine Kündigung vorhergesagt.
- False Negative: Der Kunde hat gekündigt, aber das Modell hat keine Kündigung vorhergesagt.
churn und mdl_churn_vs_relationship sind verfügbar.
Diese Übung ist Teil des Kurses
Einführung in Regression mit statsmodels in Python
Anleitung zur Übung
- Hole die tatsächlichen Antworten, indem du die Spalte
has_churneddes Datensatzes subsettest. Weise sieactual_responsezu. - Hole die „wahrscheinlichsten“ vorhergesagten Antworten aus dem Modell. Weise sie
predicted_responsezu. - Erstelle aus
actual_responseundpredicted_responseein DataFrame. Weise esoutcomeszu. - Gib
outcomesals Tabelle mit Häufigkeiten aus, die die Konfusionsmatrix darstellt. Das wurde bereits für dich erledigt.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Get the actual responses
actual_response = ____
# Get the predicted responses
predicted_response = ____
# Create outcomes as a DataFrame of both Series
outcomes = pd.DataFrame({____,
____})
# Print the outcomes
print(outcomes.value_counts(sort = False))