Nauwkeurigheid van je model
De nauwkeurigheid van het model kun je als volgt berekenen:
$$\text{Accuracy} = \frac{\text{ TP + TN }}{\text{ TP + TN + FP + FN }}$$
waarbij
- True negatives (TN): je hebt actieve medewerkers correct geïdentificeerd
- True positives (TP): je hebt inactieve medewerkers correct geïdentificeerd
- False positives (FP): je voorspelde medewerkers als inactief, maar ze zijn eigenlijk actief
- False negatives (FN): je voorspelde medewerkers als actief, maar ze zijn eigenlijk inactief
De functie confusionMatrix() uit het pakket caret berekent automatisch de nauwkeurigheid van het model, samen met andere relevante statistieken.
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in R
Oefeninstructies
- Laad het pakket
caret. - Roep
confusionMatrix()aan opconf_matrixom de nauwkeurigheid van het model te tonen. - Bekijk de output van
confusionMatrix()en sla de nauwkeurigheid van het model op inaccuracy.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load caret
library(___)
# Call confusionMatrix
___
# Choose the model's accuracy as per confusionMatrix output (0.9283 or 92.83)?
accuracy <- ___