Genauigkeitsmetrik berechnen: Precision
Der Precision-Score ist eine wichtige Kennzahl, um die Genauigkeit eines Klassifikationsalgorithmus zu messen. Er wird berechnet als der Anteil der True Positives an der Summe aus True Positives und False Positives, also $$\frac{\text{# der True Positives}}{\text{# der True Positives} + \text{# der False Positives}}.$$
- True Positives sind hier die Anzahl der Mitarbeitenden, die tatsächlich gegangen sind und korrekt als abgewandert klassifiziert wurden.
- False Positives sind die Anzahl der Mitarbeitenden, die tatsächlich geblieben sind, aber fälschlicherweise als abgewandert klassifiziert wurden.
Gibt es keine False Positives, ist der Precision-Score gleich 1. Gibt es keine True Positives, ist der Precision-Score gleich 0.
In dieser Übung berechnen wir den Precision-Score (mit der sklearn-Funktion precision_score) für unser initiales Klassifikationsmodell.
Die Variablen features_test und target_test stehen dir in deiner Arbeitsumgebung zur Verfügung.
Diese Übung ist Teil des Kurses
HR Analytics: Mitarbeiterfluktuation mit Python vorhersagen
Anleitung zur Übung
- Importiere die Funktion
precision_scoreaus dem Modulsklearn.metrics. - Nutze das initiale Modell, um Churn basierend auf den Merkmalen des Testsets vorherzusagen.
- Berechne den Precision-Score, indem du
target_testmit den Vorhersagen für das Testset vergleichst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the function to calculate precision score
from sklearn.____ import ____
# Predict whether employees will churn using the test set
prediction = model.____(features_test)
# Calculate precision score by comparing target_test with the prediction
____(target_test, ____)