LoslegenKostenlos loslegen

Die Konfusionsmatrix berechnen

Eine Konfusionsmatrix (manchmal auch Confusion Table genannt) ist die Grundlage aller Leistungskennzahlen für Modelle mit kategorialer Zielvariable (zum Beispiel eine logistische Regression). Sie enthält die Häufigkeiten jeder Kombination aus tatsächlicher und vorhergesagter Antwort. In diesem Fall, mit zwei möglichen Antworten (Abwanderung oder keine Abwanderung), ergeben sich vier Gesamtergebnisse.

  1. Die Kundin/der Kunde ist abgewandert und das Modell hat das vorhergesagt.
  2. Die Kundin/der Kunde ist abgewandert, aber das Modell hat das nicht vorhergesagt.
  3. Die Kundin/der Kunde ist nicht abgewandert, aber das Modell hat Abwanderung vorhergesagt.
  4. Die Kundin/der Kunde ist nicht abgewandert und das Modell hat das vorhergesagt.

churn und mdl_churn_vs_relationship sind verfügbar.

Diese Übung ist Teil des Kurses

Einführung in Regression mit R

Kurs anzeigen

Anleitung zur Übung

  • Hole die tatsächlichen Antworten aus der Spalte has_churned des Datensatzes. Weise sie actual_response zu.
  • Ermittle die „am wahrscheinlichsten“ vorhergesagten Antworten aus dem Modell. Weise sie predicted_response zu.
  • Erstelle eine Tabelle mit Häufigkeiten aus den Vektoren der tatsächlichen und vorhergesagten Antworten. Weise sie outcomes zu.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Get the actual responses from the dataset
actual_response <- ___

# Get the "most likely" responses from the model
predicted_response <- ___

# Create a table of counts
outcomes <- ___

# See the result
outcomes
Code bearbeiten und ausführen