De prestatie van een logistiek model meten
Zoals je inmiddels weet, zijn er verschillende metrics om de prestaties van een logistisch regressiemodel te meten. In deze laatste oefening ga je handmatig de accuracy, sensitivity en specificity berekenen. Herinner je de volgende definities:
Accuracy is de fractie voorspellingen die correct zijn. $$ \text{accuracy} = \frac{TN + TP}{TN + FN + FP + TP} $$
Sensitivity is het aandeel ware observaties dat door het model correct als waar wordt voorspeld. $$ \text{sensitivity} = \frac{TP}{TP + FN} $$
Specificity is het aandeel valse observaties dat door het model correct als vals wordt voorspeld. $$ \text{specificity} = \frac{TN}{TN + FP} $$
churn, mdl_churn_vs_relationship en conf_matrix zijn beschikbaar.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Oefeninstructies
- Haal het aantal true positives (
TP), true negatives (TN), false positives (FP) en false negatives (FN) uitconf_matrix. - Bereken de
accuracyvan het model. - Bereken de
sensitivityvan het model. - Bereken de
specificityvan het model.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Extract TN, TP, FN and FP from conf_matrix
TN = ____
TP = ____
FN = ____
FP = ____
# Calculate and print the accuracy
accuracy = ____
print("accuracy: ", accuracy)
# Calculate and print the sensitivity
sensitivity = ____
print("sensitivity: ", sensitivity)
# Calculate and print the specificity
specificity = ____
print("specificity: ", specificity)