ComenzarEmpieza gratis

Calcular la especificidad

Usar diferentes medidas del rendimiento del modelo te permite evaluarlo con mayor precisión. Existen varias métricas para distintos casos de uso. La especificidad mide la proporción de negativos verdaderos identificados correctamente:

$$\text{specificity} = \frac{TN}{TN + FP}$$

Esta fórmula implica que, a medida que la especificidad se acerca al 100 %, el número de falsos positivos (FP) tiende a 0.

En este ejercicio, vas a investigar la especificidad fuera de muestra de tu modelo con validación cruzada.

Tienes precargados los datos de entrenamiento del conjunto de clientes de tarjetas de crédito, customers_train, y una especificación de árbol de decisión, tree_spec, que se generó con el siguiente código:

tree_spec <- decision_tree() %>% 
                set_engine("rpart") %>%
                set_mode("classification")

Este ejercicio forma parte del curso

Machine Learning con modelos basados en árboles en R

Ver curso

Instrucciones del ejercicio

  • Crea tres particiones de validación cruzada (CV) de customers_train y guárdalas como folds.
  • Calcula la specificity con validación cruzada usando la función fit_resamples() que recibe tu especificación tree_spec, una fórmula de modelo, las particiones de CV y un conjunto de métricas apropiado. Usa todos los predictores para predecir still_customer, y guarda los resultados en specificities.
  • Agrega los resultados usando una única función.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create CV folds of the training data
folds <- ___(customers_train, v = ___)

# Calculate CV specificity
specificities <- ___(___, 
                     ___,
                     resamples = ___,
                     metrics = ___)

# Collect the metrics
___(specificities)
Editar y ejecutar código