Traza curvas ROC
Has visto de nuevo que el árbol potenciado obtiene el AUC más alto. Los números están bien, ¡pero las imágenes son mejores! ¿Por qué no visualizas estos resultados?
Vas a ilustrar el rendimiento del modelo dibujando todas las curvas ROC en una misma figura. Como el AUC es literalmente el área bajo estas curvas ROC, el modelo potenciado debería tener el área más grande bajo su curva ROC y ser el que quede en la esquina superior izquierda del gráfico.
El tibble de predicciones, preds_combined, sigue cargado.
Este ejercicio forma parte del curso
Machine Learning con modelos basados en árboles en R
Instrucciones del ejercicio
- Reestructura el tibble
preds_combinedpara que todas las columnas que empiezan por"preds_"pasen a ser filas en lugar de columnas. Convierte los nombres en una columna"model"y los valores en una columna llamada"predictions". - Agrupa los resultados por
model. - Calcula los valores ROC para todos los puntos de corte.
- Genera un gráfico con las curvas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Reshape the predictions into long format
predictions_long <- tidyr::pivot_longer(___,
cols = starts_with("___"),
names_to = "___",
values_to = "___")
predictions_long %>%
# Group by model
___(___) %>%
# Calculate values for every cutoff
___(truth = ___,
estimate = ___) %>%
# Create a plot from the calculated data
___()