Aan de slagGa gratis aan de slag

ROC-curves plotten

Je zag opnieuw dat de boosted tree de hoogste AUC oplevert. Cijfers zijn prima, maar plaatjes zeggen meer! Waarom visualiseer je deze resultaten niet?

Je gaat de modelprestaties illustreren door alle ROC-curves in één grafiek te plotten. Omdat de AUC letterlijk de oppervlakte onder deze ROC-curve is, zou het boosted model de grootste oppervlakte onder zijn ROC-curve moeten hebben en linksboven in de grafiek moeten liggen.

De tibble met voorspellingen, preds_combined, is nog steeds geladen.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in R

Cursus bekijken

Oefeninstructies

  • Herschik de tibble preds_combined zodat alle kolommen die beginnen met "preds_" rijen worden in plaats van kolommen. Zet de namen om naar een kolom "model" en de waarden naar een kolom "predictions".
  • Groepeer de resultaten per model.
  • Bereken de ROC-waarden voor alle cutoffs.
  • Maak een grafische plot van de curves.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Reshape the predictions into long format
predictions_long <- tidyr::pivot_longer(___,
                                        cols = starts_with("___"),
                                        names_to = "___",
                                        values_to = "___")

predictions_long %>% 
  # Group by model
  ___(___) %>% 
  # Calculate values for every cutoff
  ___(truth = ___, 
      estimate = ___) %>%
  # Create a plot from the calculated data
  ___()
Code bewerken en uitvoeren