Bereken de cross-validated prestatie
Het is cruciaal om modellen te optimaliseren met een zorgvuldig gekozen maatstaf die past bij het doel van het model.
Stel dat je in dit geval dit model wilt gebruiken om medewerkers te identificeren waarvan voorspeld wordt dat ze het bedrijf gaan verlaten. Idealiter wil je een model dat zoveel mogelijk van de vertrekkende medewerkers weet te vinden zodat je kunt ingrijpen. De bijbehorende maatstaf die dit vastlegt is de recall-metric. Daarom gebruik je in dit geval uitsluitend recall om je modellen te optimaliseren en te selecteren.
Deze oefening maakt deel uit van de cursus
Machine Learning in de tidyverse
Oefeninstructies
- Bereken de recall door voor elke fold de werkelijke met de voorspelde respons te vergelijken en zet dit in de kolom
validate_recall. - Print de kolom
validate_recall. - Print het gemiddelde van deze kolom.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_lr %>%
mutate(validate_recall = map2_dbl(___, ___,
~recall(actual = .x, predicted = .y)))
# Print the validate_recall column
cv_perf_recall$___
# Calculate the average of the validate_recall column
___