ROC y AUC dentro de la muestra
¿Qué tan bien capturan los árboles con bagging la estructura de tu conjunto de entrenamiento? ¿Son mejores que los árboles de decisión? ¿Se sobreajustan? Usar ROC y AUC es una gran forma de evaluarlo.
En este ejercicio, vas a generar estas predicciones dentro de la muestra y a calcular su ROC y AUC. ¡Atento, habrá sorpresas!
Tienes precargados el resultado del ejercicio anterior, model_bagged, y los datos de entrenamiento, customers_train.
Este ejercicio forma parte del curso
Machine Learning con modelos basados en árboles en R
Instrucciones del ejercicio
- Usa
model_baggedpara generar predicciones de probabilidad con tu conjunto de entrenamiento y añádelas al tibble de entrenamiento, guardando el resultado comopredictions. - Genera la curva ROC del tibble
predictionsy representa el resultado. - Calcula el AUC del tibble
predictions.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Predict on training set and add to training set
predictions <- ___(___,
new_data = ___,
type = "___") %>%
bind_cols(___)
# Create and plot the ROC curve
roc_curve(___,
estimate = ___,
truth = ___) %>% autoplot()
# Calculate the AUC
___(predictions,
estimate = ___,
truth = ___)