Crea un modelo de random forest

Aquí vas a usar los mismos datos de validación cruzada para construir (con train) y evaluar (con validate) random forests para cada partición. Como estás usando las mismas particiones de validación cruzada que en tus modelos de regresión, podrás comparar directamente el rendimiento de ambos modelos.

Nota: Limitaremos nuestros random forests a 100 árboles para que el ajuste termine en un tiempo razonable. El número de árboles por defecto de ranger() es 500.

Este ejercicio forma parte del curso

Machine Learning en el tidyverse

Ver curso

Instrucciones del ejercicio

Usa ranger() para construir un random forest que prediga life_expectancy utilizando todas las variables de train para cada partición de validación cruzada.
Añade una nueva columna validate_predicted que prediga life_expectancy para las observaciones de validate usando los modelos de random forest que acabas de crear.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

library(ranger)

# Build a random forest model for each fold
cv_models_rf <- cv_data %>% 
  mutate(model = map(___, ~ranger(formula = ___, data = ___,
                                    num.trees = 100, seed = 42)))

# Generate predictions using the random forest model
cv_prep_rf <- cv_models_rf %>% 
  mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))

Editar y ejecutar código