CommencerCommencer gratuitement

Tracer des courbes ROC

Vous avez de nouveau constaté que l’arbre boosté obtient l’AUC la plus élevée. Les chiffres, c’est bien, mais un graphique, c’est encore mieux ! Pourquoi ne pas visualiser ces résultats ?

Vous allez illustrer la performance des modèles en traçant toutes les courbes ROC sur un même graphique. Comme l’AUC correspond littéralement à l’aire sous la courbe ROC, le modèle boosté devrait avoir la plus grande aire sous sa courbe et se situer dans l’angle supérieur gauche du graphique.

Le tibble de prédictions, preds_combined, est toujours chargé.

Cet exercice fait partie du cours

Machine Learning avec des modèles à base d’arbres en R

Afficher le cours

Instructions

  • Remodelez le tibble preds_combined afin que toutes les colonnes commençant par "preds_" deviennent des lignes plutôt que des colonnes. Convertissez les noms en une colonne "model" et les valeurs en une colonne appelée "predictions".
  • Regroupez les résultats par model.
  • Calculez les valeurs de la courbe ROC pour tous les seuils.
  • Produisez un graphique des courbes.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Reshape the predictions into long format
predictions_long <- tidyr::pivot_longer(___,
                                        cols = starts_with("___"),
                                        names_to = "___",
                                        values_to = "___")

predictions_long %>% 
  # Group by model
  ___(___) %>% 
  # Calculate values for every cutoff
  ___(truth = ___, 
      estimate = ___) %>%
  # Create a plot from the calculated data
  ___()
Modifier et exécuter le code