Calcular la especificidad
Usar diferentes medidas del rendimiento del modelo te permite evaluarlo con mayor precisión. Existen varias métricas para distintos casos de uso. La especificidad mide la proporción de negativos verdaderos identificados correctamente:
$$\text{specificity} = \frac{TN}{TN + FP}$$
Esta fórmula implica que, a medida que la especificidad se acerca al 100 %, el número de falsos positivos (FP) tiende a 0.
En este ejercicio, vas a investigar la especificidad fuera de muestra de tu modelo con validación cruzada.
Tienes precargados los datos de entrenamiento del conjunto de clientes de tarjetas de crédito, customers_train, y una especificación de árbol de decisión, tree_spec, que se generó con el siguiente código:
tree_spec <- decision_tree() %>%
set_engine("rpart") %>%
set_mode("classification")
Este ejercicio forma parte del curso
Machine Learning con modelos basados en árboles en R
Instrucciones del ejercicio
- Crea tres particiones de validación cruzada (CV) de
customers_trainy guárdalas comofolds. - Calcula la
specificitycon validación cruzada usando la funciónfit_resamples()que recibe tu especificacióntree_spec, una fórmula de modelo, las particiones de CV y un conjunto de métricas apropiado. Usa todos los predictores para predecirstill_customer, y guarda los resultados enspecificities. - Agrega los resultados usando una única función.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create CV folds of the training data
folds <- ___(customers_train, v = ___)
# Calculate CV specificity
specificities <- ___(___,
___,
resamples = ___,
metrics = ___)
# Collect the metrics
___(specificities)