Mesurer la performance d'un modèle logistique
Comme vous le savez maintenant, il existe plusieurs paramètres pour mesurer la performance d'un modèle de régression logistique. Dans ce dernier exercice, vous calculerez manuellement la précision, la sensibilité et la spécificité. Rappelons les définitions suivantes :
La précision est la proportion de prédictions correctes. $$ \text{accuracy} = \frac{TN + TP}{TN + FN + FP + TP} $$
La sensibilité est la proportion d'observations vraies qui sont correctement prédites par le modèle comme étant vraies. $$ \text{sensitivity} = \frac{TP}{TP + FN} $$
La spécificité est la proportion d'observations fausses qui sont correctement prédites par le modèle comme étant fausses. $$ \text{specificity} = \frac{TN}{TN + FP} $$
churn
, mdl_churn_vs_relationship
et conf_matrix
sont disponibles.
Cet exercice fait partie du cours
Introduction à la régression avec statsmodels en Python
Instructions
- Extrayez le nombre de vrais positifs (
TP
), de vrais négatifs (TN
), de faux positifs (FP
) et de faux négatifs (FN
) deconf_matrix
. - Calculez le
accuracy
du modèle. - Calculez le
sensitivity
du modèle. - Calculez le
specificity
du modèle.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extract TN, TP, FN and FP from conf_matrix
TN = ____
TP = ____
FN = ____
FP = ____
# Calculate and print the accuracy
accuracy = ____
print("accuracy: ", accuracy)
# Calculate and print the sensitivity
sensitivity = ____
print("sensitivity: ", sensitivity)
# Calculate and print the specificity
specificity = ____
print("specificity: ", specificity)