Calcular el rendimiento con validación cruzada
Es fundamental optimizar los modelos usando una métrica cuidadosamente seleccionada y alineada con el objetivo del modelo.
Imagina que en este caso quieres usar este modelo para identificar a los empleados que se prevé que dejen la empresa. Idealmente, quieres un modelo que capture al mayor número posible de empleados a punto de irse para poder intervenir. La métrica correspondiente que mide esto es el recall. Por tanto, usarás exclusivamente recall para optimizar y seleccionar tus modelos.
Este ejercicio forma parte del curso
Machine Learning en el tidyverse
Instrucciones del ejercicio
- Calcula el recall comparando las respuestas reales con las predichas para cada fold y asígnalo a la columna
validate_recall. - Imprime la columna
validate_recall. - Imprime la media de esta columna.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_lr %>%
mutate(validate_recall = map2_dbl(___, ___,
~recall(actual = .x, predicted = .y)))
# Print the validate_recall column
cv_perf_recall$___
# Calculate the average of the validate_recall column
___