Tracer des courbes ROC
Vous avez de nouveau constaté que l’arbre boosté obtient l’AUC la plus élevée. Les chiffres, c’est bien, mais un graphique, c’est encore mieux ! Pourquoi ne pas visualiser ces résultats ?
Vous allez illustrer la performance des modèles en traçant toutes les courbes ROC sur un même graphique. Comme l’AUC correspond littéralement à l’aire sous la courbe ROC, le modèle boosté devrait avoir la plus grande aire sous sa courbe et se situer dans l’angle supérieur gauche du graphique.
Le tibble de prédictions, preds_combined, est toujours chargé.
Cet exercice fait partie du cours
Machine Learning avec des modèles à base d’arbres en R
Instructions
- Remodelez le tibble
preds_combinedafin que toutes les colonnes commençant par"preds_"deviennent des lignes plutôt que des colonnes. Convertissez les noms en une colonne"model"et les valeurs en une colonne appelée"predictions". - Regroupez les résultats par
model. - Calculez les valeurs de la courbe ROC pour tous les seuils.
- Produisez un graphique des courbes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Reshape the predictions into long format
predictions_long <- tidyr::pivot_longer(___,
cols = starts_with("___"),
names_to = "___",
values_to = "___")
predictions_long %>%
# Group by model
___(___) %>%
# Calculate values for every cutoff
___(truth = ___,
estimate = ___) %>%
# Create a plot from the calculated data
___()