1. Learn
  2. /
  3. Courses
  4. /
  5. Introduction à la régression avec statsmodels en Python

Connected

Exercise

Calcul de la matrice de confusion

Une matrice de confusion (parfois appelée table de confusion) sert de base à toutes les mesures de performance pour les modèles dont la variable réponse est catégorielle (comme une régression logistique). Elle contient les comptes de chaque paire réponse réelle–réponse prévue. Dans ce cas, où il y a deux réponses possibles (fermeture de compte ou non), on obtient quatre issues possibles.

  1. Vrai positif : Le client a fermé son compte et le modèle l'a prédit.
  2. Faux positif : Le client n'a pas fermé son compte, mais le modèle a prédit qu'il le ferait.
  3. Vrai négatif : Le client n'a pas fermé son compte et le modèle a prédit qu'il ne le ferait pas.
  4. Faux négatif : Le client a fermé son compte, mais le modèle a prédit qu'il ne le ferait pas.

churn et mdl_churn_vs_relationship sont disponibles.

Instructions

100 XP
  • Obtenez les réponses réelles en sélectionnant la colonne has_churned de l'ensemble de données. Assignez le résultat à actual_response.
  • Obtenez les réponses prévues « les plus probables » à partir du modèle. Assignez-les à predicted_response.
  • Créez un DataFrame à partir de actual_response et predicted_response. Assignez-le à outcomes.
  • Affichez outcomes sous forme de tableau de comptes, représentant la matrice de confusion. Ceci a été fait pour vous.