1. Apprendre
  2. /
  3. Cours
  4. /
  5. Introduction à la régression en R

Connected

Exercice

Calcul de la matrice de confusion

Une matrice de confusion (parfois appelée table de confusion) est à la base de toutes les mesures de performance pour les modèles dont la réponse est catégorielle (comme une régression logistique). Elle contient les effectifs de chaque paire réponse réelle–réponse prédite. Dans ce cas, où il y a deux réponses possibles (désabonnement ou non), on obtient quatre issues possibles.

  1. La personne cliente s'est désabonnée et le modèle l'a prédit.
  2. La personne cliente s'est désabonnée, mais le modèle ne l'a pas prédit.
  3. La personne cliente ne s'est pas désabonnée, mais le modèle a prédit le contraire.
  4. La personne cliente ne s'est pas désabonnée et le modèle l'a prédit.

churn et mdl_churn_vs_relationship sont disponibles.

Instructions

100 XP
  • Récupérez les réponses réelles à partir de la colonne has_churned de l'ensemble de données. Assignez-les à actual_response.
  • Récupérez les réponses « les plus probables » prévues par le modèle. Assignez-les à predicted_response.
  • Créez un tableau des effectifs à partir des vecteurs de réponses réelles et prédites. Assignez-le à outcomes.