Crea un modelo de random forest
Aquí vas a usar los mismos datos de validación cruzada para construir (con train) y evaluar (con validate) random forests para cada partición. Como estás usando las mismas particiones de validación cruzada que en tus modelos de regresión, podrás comparar directamente el rendimiento de ambos modelos.
Nota: Limitaremos nuestros random forests a 100 árboles para que el ajuste termine en un tiempo razonable. El número de árboles por defecto de ranger() es 500.
Este ejercicio forma parte del curso
Machine Learning en el tidyverse
Instrucciones del ejercicio
- Usa
ranger()para construir un random forest que predigalife_expectancyutilizando todas las variables detrainpara cada partición de validación cruzada. - Añade una nueva columna
validate_predictedque predigalife_expectancypara las observaciones devalidateusando los modelos de random forest que acabas de crear.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
library(ranger)
# Build a random forest model for each fold
cv_models_rf <- cv_data %>%
mutate(model = map(___, ~ranger(formula = ___, data = ___,
num.trees = 100, seed = 42)))
# Generate predictions using the random forest model
cv_prep_rf <- cv_models_rf %>%
mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))