Nauwkeurigheidsmaat berekenen: precision

De precision-score is een belangrijke maat om de nauwkeurigheid van een classificatie-algoritme te beoordelen. Hij wordt berekend als het aandeel True Positives ten opzichte van de som van True Positives en False Positives, oftewel $$\frac{\text{# True Positives}}{\text{# True Positives} + \text{# False Positives}}.$$

we definiëren True Positives als het aantal medewerkers dat daadwerkelijk is vertrokken en ook correct als vertrekkend is geclassificeerd
we definiëren False Positives als het aantal medewerkers dat daadwerkelijk is gebleven, maar onterecht als vertrekkend is geclassificeerd

Als er geen False Positives zijn, is de precision-score gelijk aan 1. Als er geen True Positives zijn, is de precision-score gelijk aan 0.

In deze oefening bereken je de precision-score (met de sklearn-functie precision_score) voor ons eerste classificatiemodel.

De variabelen features_test en target_test zijn beschikbaar in je werkruimte.

Deze oefening maakt deel uit van de cursus

HR-analytics: verloop van medewerkers voorspellen in Python

Bekijk cursus

Oefeninstructies

Importeer de functie precision_score uit de module sklearn.metrics.
Gebruik het eerste model om churn te voorspellen (op basis van de features van de testset).
Bereken de precision-score door target_test te vergelijken met de voorspellingen op de testset.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import the function to calculate precision score
from sklearn.____ import ____

# Predict whether employees will churn using the test set
prediction = model.____(features_test)

# Calculate precision score by comparing target_test with the prediction
____(target_test, ____)

Code bewerken en uitvoeren