Ajusta un random forest
Como viste en el vídeo, los modelos de random forest son mucho más flexibles que los modelos lineales y pueden capturar efectos no lineales complejos, además de identificar automáticamente interacciones entre variables. Suelen dar muy buenos resultados con datos del mundo real, así que probemos uno con el conjunto de datos de calidad del vino, donde el objetivo es predecir la calidad evaluada por personas de un lote de vino, a partir de algunas propiedades químicas y físicas medidas por máquina de ese lote.
Ajustar un modelo de random forest es exactamente igual que ajustar un modelo de regresión lineal generalizada, como hiciste en el capítulo anterior. Simplemente cambia el argumento method en la función train a "ranger". El paquete ranger es una reimplementación del clásico paquete randomForest de R y ajusta modelos mucho más rápido, pero ofrece prácticamente los mismos resultados. Recomendamos que todas las personas que empiezan usen el paquete ranger para modelado con random forest.
Este ejercicio forma parte del curso
Machine Learning con caret en R
Instrucciones del ejercicio
- Entrena un random forest llamado
modelsobre el conjunto de datos de calidad del vino,wine, de forma quequalitysea la variable respuesta y el resto de variables sean explicativas. - Usa
method = "ranger". - Usa un
tuneLengthde 1. - Usa 5 pliegues de validación cruzada (CV).
- Imprime
modelen la consola.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Fit random forest: model
model <- train(
___,
tuneLength = ___,
data = ___,
method = ___,
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console