1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în regresia cu statsmodels în Python

Connected

exercițiu

Calcularea matricei de confuzie

O matrice de confuzie (numită uneori și tabel de confuzie) stă la baza tuturor metricilor de performanță pentru modelele cu un răspuns categorial (cum ar fi regresia logistică). Aceasta conține numărul de apariții pentru fiecare pereche răspuns real – răspuns prezis. În cazul de față, unde există două răspunsuri posibile (churn sau fără churn), există patru rezultate posibile.

  1. Adevărat pozitiv: Clientul a renunțat la serviciu, iar modelul a prezis că va face asta.
  2. Fals pozitiv: Clientul nu a renunțat la serviciu, dar modelul a prezis că va face asta.
  3. Adevărat negativ: Clientul nu a renunțat la serviciu, iar modelul a prezis că nu va face asta.
  4. Fals negativ: Clientul a renunțat la serviciu, dar modelul a prezis că nu va face asta.

churn și mdl_churn_vs_relationship sunt disponibile.

Instrucțiuni

100 XP
  • Obține răspunsurile reale prin selectarea coloanei has_churned din setul de date. Atribuie rezultatul variabilei actual_response.
  • Obține răspunsurile prezise „cele mai probabile" din model. Atribuie rezultatul variabilei predicted_response.
  • Creează un DataFrame din actual_response și predicted_response. Atribuie rezultatul variabilei outcomes.
  • Afișează outcomes ca tabel de numărători, reprezentând matricea de confuzie. Acest pas a fost deja realizat pentru tine.