Messung der Leistung logistischer Modelle
Wie du inzwischen weißt, gibt es mehrere Messgrößen, um die Leistung eines logistischen Regressionsmodells zu messen. In dieser letzten Übung berechnest du manuell die Genauigkeit, Sensitivität und Spezifität. Erinnere dich an die folgenden Definitionen:
Die Genauigkeit ist der Anteil der Vorhersagen, die richtig sind. $$ \text{accuracy} = \frac{TN + TP}{TN + FN + FP + TP} $$
Die Sensitivität ist der Anteil der wahren Beobachtungen, die vom Modell korrekt als wahr vorhergesagt werden. $$ \text{sensitivity} = \frac{TP}{TP + FN} $$
Die Spezifität ist der Anteil der falschen Beobachtungen, die vom Modell korrekt als falsch vorhergesagt werden. $$ \text{specificity} = \frac{TN}{TN + FP} $$
churn
, mdl_churn_vs_relationship
, und conf_matrix
sind verfügbar.
Diese Übung ist Teil des Kurses
Einführung in die Regression mit statsmodels in Python
Anleitung zur Übung
- Extrahiere die Anzahl der richtig positiven (
TP
), richtig negativen (TN
), falsch positiven (FP
) und falsch negativen (FN
) Ergebnisse ausconf_matrix
. - Berechne die
accuracy
des Modells. - Berechne die
sensitivity
des Modells. - Berechne die
specificity
des Modells.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Extract TN, TP, FN and FP from conf_matrix
TN = ____
TP = ____
FN = ____
FP = ____
# Calculate and print the accuracy
accuracy = ____
print("accuracy: ", accuracy)
# Calculate and print the sensitivity
sensitivity = ____
print("sensitivity: ", sensitivity)
# Calculate and print the specificity
specificity = ____
print("specificity: ", specificity)