ComenzarEmpieza gratis

Rendimiento de random forest

Ha llegado el momento de comprobar si los modelos de random forest que construiste en el ejercicio anterior pueden superar al modelo de regresión logística.

Recuerda que el recall en validate para el modelo de regresión logística fue 0.43.

Este ejercicio forma parte del curso

Machine Learning en el tidyverse

Ver curso

Instrucciones del ejercicio

  • Prepara las columnas validate_actual y validate_predicted para cada combinación de mtry/fold.
  • Calcula el recall para cada combinación de mtry/fold.
  • Calcula el recall medio para cada valor de mtry.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

cv_prep_rf <- cv_models_rf %>% 
  mutate(
    # Prepare binary vector of actual Attrition values in validate
    validate_actual = map(validate, ~.x$___ == "___"),
    # Prepare binary vector of predicted Attrition values for validate
    validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y, type = "response")$predictions == "Yes")
  )

# Calculate the validate recall for each cross validation fold
cv_perf_recall <- cv_prep_rf %>% 
  mutate(recall = map2_dbl(.x = ___, .y = ___, ~recall(actual = .x, predicted = .y)))

# Calculate the mean recall for each mtry used  
cv_perf_recall %>% 
  group_by(___) %>% 
  summarise(mean_recall = mean(___))
Editar y ejecutar código