El mejor parámetro en rendimiento
Ya has creado modelos variando el hiperparámetro específico de random forest mtry con la idea de mejorar aún más tu modelo. Ahora medirás el rendimiento de cada valor de mtry en las 5 particiones de validación cruzada para ver si puedes mejorar el modelo.
Recuerda que la MAE de validación que calculaste hace dos ejercicios, de 0.795, correspondía al valor predeterminado de mtry de 2.
Este ejercicio forma parte del curso
Machine Learning en el tidyverse
Instrucciones del ejercicio
- Genera predicciones para cada combinación de mtry/pliegue.
- Calcula la MAE para cada combinación de mtry/pliegue.
- Calcula la MAE media para cada valor de
mtry.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Generate validate predictions for each model
cv_prep_tunerf <- cv_model_tunerf %>%
mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))
# Calculate validate MAE for each fold and mtry combination
cv_eval_tunerf <- cv_prep_tunerf %>%
mutate(validate_mae = map2_dbl(.x = ___, .y = ___, ~mae(actual = .x, predicted = .y)))
# Calculate the mean validate_mae for each mtry used
cv_eval_tunerf %>%
group_by(___) %>%
summarise(mean_mae = mean(___))