Aan de slagGa gratis aan de slag

Nauwkeurigheidsmaat berekenen: precision

De precision-score is een belangrijke maat om de nauwkeurigheid van een classificatie-algoritme te beoordelen. Hij wordt berekend als het aandeel True Positives ten opzichte van de som van True Positives en False Positives, oftewel $$\frac{\text{# True Positives}}{\text{# True Positives} + \text{# False Positives}}.$$

  • we definiëren True Positives als het aantal medewerkers dat daadwerkelijk is vertrokken en ook correct als vertrekkend is geclassificeerd
  • we definiëren False Positives als het aantal medewerkers dat daadwerkelijk is gebleven, maar onterecht als vertrekkend is geclassificeerd

Als er geen False Positives zijn, is de precision-score gelijk aan 1. Als er geen True Positives zijn, is de precision-score gelijk aan 0.

In deze oefening bereken je de precision-score (met de sklearn-functie precision_score) voor ons eerste classificatiemodel.

De variabelen features_test en target_test zijn beschikbaar in je werkruimte.

Deze oefening maakt deel uit van de cursus

HR-analytics: verloop van medewerkers voorspellen in Python

Cursus bekijken

Oefeninstructies

  • Importeer de functie precision_score uit de module sklearn.metrics.
  • Gebruik het eerste model om churn te voorspellen (op basis van de features van de testset).
  • Bereken de precision-score door target_test te vergelijken met de voorspellingen op de testset.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the function to calculate precision score
from sklearn.____ import ____

# Predict whether employees will churn using the test set
prediction = model.____(features_test)

# Calculate precision score by comparing target_test with the prediction
____(target_test, ____)
Code bewerken en uitvoeren