Specificity berekenen
Door verschillende maten voor modelprestatie te gebruiken, kun je die nauwkeuriger beoordelen. Er zijn meerdere metriekken voor verschillende use-cases. Specificity meet het aandeel true negatives dat correct wordt herkend:
$$\text{specificity} = \frac{TN}{TN + FP}$$
Deze formule betekent dat als specificity richting 100% gaat, het aantal false positives (FP) naar 0 gaat.
In deze oefening onderzoek je de out-of-sample specificity van je model met cross-validatie.
Vooraf geladen zijn de trainingsgegevens van de creditcardklantengegevensset, customers_train, en een beslisboom-specificatie, tree_spec, die is aangemaakt met de volgende code:
tree_spec <- decision_tree() %>%
set_engine("rpart") %>%
set_mode("classification")
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in R
Oefeninstructies
- Maak drie CV-folds van
customers_trainen sla die op alsfolds. - Bereken cross-validated
specificitymet de functiefit_resamples()die je specificatietree_spec, een modelformule, de CV-folds en een passende metric set gebruikt. Gebruik alle voorspellers omstill_customerte voorspellen en sla de resultaten op inspecificities. - Vat de resultaten samen met één functie.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create CV folds of the training data
folds <- ___(customers_train, v = ___)
# Calculate CV specificity
specificities <- ___(___,
___,
resamples = ___,
metrics = ___)
# Collect the metrics
___(specificities)