Medição do desempenho do modelo logístico
Como você já sabe, existem várias métricas para medir o desempenho de um modelo de regressão logística. Neste último exercício, você calculará manualmente a precisão, a sensibilidade e a especificidade. Lembre-se das seguintes definições:
A precisão é a proporção de previsões que estão corretas. $$ \text{accuracy} = \frac{TN + TP}{TN + FN + FP + TP} $$
A sensibilidade é a proporção de observações verdadeiras que são corretamente previstas pelo modelo como sendo verdadeiras. $$ \text{sensitivity} = \frac{TP}{TP + FN} $$
Especificidade é a proporção de observações falsas que são corretamente previstas pelo modelo como sendo falsas. $$ \text{specificity} = \frac{TN}{TN + FP} $$
churn
Você pode acessar os sites mdl_churn_vs_relationship
e conf_matrix
.
Este exercício faz parte do curso
Introdução à regressão com statsmodels em Python
Instruções de exercício
- Extraia o número de verdadeiros positivos (
TP
), verdadeiros negativos (TN
), falsos positivos (FP
) e falsos negativos (FN
) deconf_matrix
. - Calcule o
accuracy
do modelo. - Calcule o
sensitivity
do modelo. - Calcule o
specificity
do modelo.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Extract TN, TP, FN and FP from conf_matrix
TN = ____
TP = ____
FN = ____
FP = ____
# Calculate and print the accuracy
accuracy = ____
print("accuracy: ", accuracy)
# Calculate and print the sensitivity
sensitivity = ____
print("sensitivity: ", sensitivity)
# Calculate and print the specificity
specificity = ____
print("specificity: ", specificity)