De confusion matrix berekenen
Een confusion matrix (ook wel confusion table genoemd) is de basis voor alle prestatiematen van modellen met een categorische respons (zoals een logistische regressie). De matrix bevat de aantallen van elk paar van werkelijke respons en voorspelde respons. In dit geval, met twee mogelijke uitkomsten (opzeggen of niet opzeggen), zijn er vier mogelijke situaties.
- De klant heeft opgezegd en het model voorspelde dat.
- De klant heeft opgezegd, maar het model voorspelde dat niet.
- De klant zegde niet op, maar het model voorspelde van wel.
- De klant zegde niet op en het model voorspelde dat ook.
churn en mdl_churn_vs_relationship zijn beschikbaar.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie in R
Oefeninstructies
- Haal de werkelijke responses op uit de kolom
has_churnedvan de gegevensset. Ken toe aanactual_response. - Haal de "meest waarschijnlijke" voorspelde responses uit het model. Ken toe aan
predicted_response. - Maak een tabel met aantallen op basis van de werkelijke en voorspelde responsvectoren. Ken toe aan
outcomes.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Get the actual responses from the dataset
actual_response <- ___
# Get the "most likely" responses from the model
predicted_response <- ___
# Create a table of counts
outcomes <- ___
# See the result
outcomes