Curve ROC e area sotto la curva ROC
Le curve ROC vengono utilizzate per visualizzare le prestazioni di un modello di classificazione su un insieme di soglie di probabilità. Una curva ROC con la maggior parte dei punti vicino all’angolo in alto a sinistra del grafico indica che il modello di classificazione riesce a prevedere correttamente sia gli esiti positivi sia quelli negativi su un’ampia gamma di soglie di probabilità.
L’area sotto questa curva offre un riepilogo sintetico (in stile “voto in lettera”) delle prestazioni del modello.
In questo esercizio creerai una curva ROC a partire dai risultati del tuo modello di regressione logistica e calcolerai l’area sotto la curva ROC con yardstick.
La tua tibble dei risultati del modello, telecom_results, è stata caricata nella sessione.
Questo esercizio fa parte del corso
Modellazione con tidymodels in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate metrics across thresholds
threshold_df <- ___ %>%
___(truth = ___, ___)
# View results
threshold_df