Rendimiento de random forest
Ha llegado el momento de comprobar si los modelos de random forest que construiste en el ejercicio anterior pueden superar al modelo de regresión logística.
Recuerda que el recall en validate para el modelo de regresión logística fue 0.43.
Este ejercicio forma parte del curso
Machine Learning en el tidyverse
Instrucciones del ejercicio
- Prepara las columnas
validate_actualyvalidate_predictedpara cada combinación de mtry/fold. - Calcula el recall para cada combinación de mtry/fold.
- Calcula el recall medio para cada valor de
mtry.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
cv_prep_rf <- cv_models_rf %>%
mutate(
# Prepare binary vector of actual Attrition values in validate
validate_actual = map(validate, ~.x$___ == "___"),
# Prepare binary vector of predicted Attrition values for validate
validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y, type = "response")$predictions == "Yes")
)
# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_rf %>%
mutate(recall = map2_dbl(.x = ___, .y = ___, ~recall(actual = .x, predicted = .y)))
# Calculate the mean recall for each mtry used
cv_perf_recall %>%
group_by(___) %>%
summarise(mean_recall = mean(___))