ROC-curves plotten
Je zag opnieuw dat de boosted tree de hoogste AUC oplevert. Cijfers zijn prima, maar plaatjes zeggen meer! Waarom visualiseer je deze resultaten niet?
Je gaat de modelprestaties illustreren door alle ROC-curves in één grafiek te plotten. Omdat de AUC letterlijk de oppervlakte onder deze ROC-curve is, zou het boosted model de grootste oppervlakte onder zijn ROC-curve moeten hebben en linksboven in de grafiek moeten liggen.
De tibble met voorspellingen, preds_combined, is nog steeds geladen.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in R
Oefeninstructies
- Herschik de tibble
preds_combinedzodat alle kolommen die beginnen met"preds_"rijen worden in plaats van kolommen. Zet de namen om naar een kolom"model"en de waarden naar een kolom"predictions". - Groepeer de resultaten per
model. - Bereken de ROC-waarden voor alle cutoffs.
- Maak een grafische plot van de curves.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Reshape the predictions into long format
predictions_long <- tidyr::pivot_longer(___,
cols = starts_with("___"),
names_to = "___",
values_to = "___")
predictions_long %>%
# Group by model
___(___) %>%
# Calculate values for every cutoff
___(truth = ___,
estimate = ___) %>%
# Create a plot from the calculated data
___()