Calcul de la matrice de confusion
Une matrice de confusion (parfois appelée tableau de confusion) constitue la base de tous les indicateurs de performance pour les modèles avec une réponse catégorielle (tels que la régression logistique). Elle contient le nombre de chaque paire réponse réelle-réponse prédite. Dans ce cas, où il existe deux réponses possibles (attrition ou non), il y a quatre résultats globaux.
- Le client est parti et le modèle l'avait prédit.
- Le client est parti, mais le modèle n'avait pas prévu cela.
- Le client n’est pas parti, mais le modèle avait prédit qu'il le ferait.
- Le client n’est pas parti, ce que le modèle avait prédit.
churn et mdl_churn_vs_relationship sont disponibles.
Cet exercice fait partie du cours
Introduction à la régression dans R
Instructions
- Récupérer les réponses réelles à partir de la colonne
has_churnedde l'ensemble de données. Affecter le résultat àactual_response. - Obtenir les réponses « les plus probables » prédites par le modèle. Affecter le résultat à
predicted_response. - Créer une table de comptage à partir des vecteurs de réponse réels et prédits. Affecter le résultat à
outcomes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Get the actual responses from the dataset
actual_response <- ___
# Get the "most likely" responses from the model
predicted_response <- ___
# Create a table of counts
outcomes <- ___
# See the result
outcomes