ComenzarEmpieza gratis

Calcular el rendimiento con validación cruzada

Es fundamental optimizar los modelos usando una métrica cuidadosamente seleccionada y alineada con el objetivo del modelo.

Imagina que en este caso quieres usar este modelo para identificar a los empleados que se prevé que dejen la empresa. Idealmente, quieres un modelo que capture al mayor número posible de empleados a punto de irse para poder intervenir. La métrica correspondiente que mide esto es el recall. Por tanto, usarás exclusivamente recall para optimizar y seleccionar tus modelos.

Este ejercicio forma parte del curso

Machine Learning en el tidyverse

Ver curso

Instrucciones del ejercicio

  • Calcula el recall comparando las respuestas reales con las predichas para cada fold y asígnalo a la columna validate_recall.
  • Imprime la columna validate_recall.
  • Imprime la media de esta columna.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_lr %>% 
  mutate(validate_recall = map2_dbl(___, ___, 
                                    ~recall(actual = .x, predicted = .y)))

# Print the validate_recall column
cv_perf_recall$___

# Calculate the average of the validate_recall column
___
Editar y ejecutar código