Aan de slagGa gratis aan de slag

De confusion matrix berekenen

Een confusion matrix (ook wel confusion table genoemd) is de basis voor alle prestatiematen van modellen met een categorische respons (zoals een logistische regressie). De matrix bevat de aantallen van elk paar van werkelijke respons en voorspelde respons. In dit geval, met twee mogelijke uitkomsten (opzeggen of niet opzeggen), zijn er vier mogelijke situaties.

  1. De klant heeft opgezegd en het model voorspelde dat.
  2. De klant heeft opgezegd, maar het model voorspelde dat niet.
  3. De klant zegde niet op, maar het model voorspelde van wel.
  4. De klant zegde niet op en het model voorspelde dat ook.

churn en mdl_churn_vs_relationship zijn beschikbaar.

Deze oefening maakt deel uit van de cursus

Introductie tot regressie in R

Cursus bekijken

Oefeninstructies

  • Haal de werkelijke responses op uit de kolom has_churned van de gegevensset. Ken toe aan actual_response.
  • Haal de "meest waarschijnlijke" voorspelde responses uit het model. Ken toe aan predicted_response.
  • Maak een tabel met aantallen op basis van de werkelijke en voorspelde responsvectoren. Ken toe aan outcomes.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Get the actual responses from the dataset
actual_response <- ___

# Get the "most likely" responses from the model
predicted_response <- ___

# Create a table of counts
outcomes <- ___

# See the result
outcomes
Code bewerken en uitvoeren