Nauwkeurigheidsmaat berekenen: precision
De precision-score is een belangrijke maat om de nauwkeurigheid van een classificatie-algoritme te beoordelen. Hij wordt berekend als het aandeel True Positives ten opzichte van de som van True Positives en False Positives, oftewel $$\frac{\text{# True Positives}}{\text{# True Positives} + \text{# False Positives}}.$$
- we definiëren True Positives als het aantal medewerkers dat daadwerkelijk is vertrokken en ook correct als vertrekkend is geclassificeerd
- we definiëren False Positives als het aantal medewerkers dat daadwerkelijk is gebleven, maar onterecht als vertrekkend is geclassificeerd
Als er geen False Positives zijn, is de precision-score gelijk aan 1. Als er geen True Positives zijn, is de precision-score gelijk aan 0.
In deze oefening bereken je de precision-score (met de sklearn-functie precision_score) voor ons eerste classificatiemodel.
De variabelen features_test en target_test zijn beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in Python
Oefeninstructies
- Importeer de functie
precision_scoreuit de modulesklearn.metrics. - Gebruik het eerste model om churn te voorspellen (op basis van de features van de testset).
- Bereken de precision-score door
target_testte vergelijken met de voorspellingen op de testset.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the function to calculate precision score
from sklearn.____ import ____
# Predict whether employees will churn using the test set
prediction = model.____(features_test)
# Calculate precision score by comparing target_test with the prediction
____(target_test, ____)