CommencerCommencer gratuitement

Calcul de la matrice de confusion

Une matrice de confusion (parfois appelée tableau de confusion) constitue la base de tous les indicateurs de performance pour les modèles avec une réponse catégorielle (tels que la régression logistique). Elle contient le nombre de chaque paire réponse réelle-réponse prédite. Dans ce cas, où il existe deux réponses possibles (attrition ou non), il y a quatre résultats globaux.

  1. Le client est parti et le modèle l'avait prédit.
  2. Le client est parti, mais le modèle n'avait pas prévu cela.
  3. Le client n’est pas parti, mais le modèle avait prédit qu'il le ferait.
  4. Le client n’est pas parti, ce que le modèle avait prédit.

churn et mdl_churn_vs_relationship sont disponibles.

Cet exercice fait partie du cours

Introduction à la régression dans R

Afficher le cours

Instructions

  • Récupérer les réponses réelles à partir de la colonne has_churned de l'ensemble de données. Affecter le résultat à actual_response.
  • Obtenir les réponses « les plus probables » prédites par le modèle. Affecter le résultat à predicted_response.
  • Créer une table de comptage à partir des vecteurs de réponse réels et prédits. Affecter le résultat à outcomes.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Get the actual responses from the dataset
actual_response <- ___

# Get the "most likely" responses from the model
predicted_response <- ___

# Create a table of counts
outcomes <- ___

# See the result
outcomes
Modifier et exécuter le code