Ajusta bien tu modelo
¡Vaya! Eso ha sido una mejora importante respecto a un modelo de regresión. Ahora, veamos si puedes mejorar aún más el rendimiento ajustando finamente tus modelos de random forest. Para ello, variarás el parámetro mtry al construir tus modelos de random forest con tus datos de train.
El valor predeterminado de mtry para ranger es la raíz cuadrada del número total de características (6), redondeada hacia abajo. Esto da como resultado un valor de 2.
Este ejercicio forma parte del curso
Machine Learning en el tidyverse
Instrucciones del ejercicio
- Usa
crossing()para ampliar los datos de validación cruzada con valores demtrydel 2 al 5. - Crea modelos de random forest para cada combinación de fold/mtry.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Prepare for tuning your cross validation folds by varying mtry
cv_tune <- cv_data %>%
crossing(mtry = ___:___)
# Build a model for each fold & mtry combination
cv_model_tunerf <- cv_tune %>%
mutate(model = map2(.x = ___, .y = ___, ~ranger(formula = life_expectancy~.,
data = .x, mtry = .y,
num.trees = 100, seed = 42)))