ComenzarEmpieza gratis

Ajusta un random forest

Como viste en el vídeo, los modelos de random forest son mucho más flexibles que los modelos lineales y pueden capturar efectos no lineales complejos, además de identificar automáticamente interacciones entre variables. Suelen dar muy buenos resultados con datos del mundo real, así que probemos uno con el conjunto de datos de calidad del vino, donde el objetivo es predecir la calidad evaluada por personas de un lote de vino, a partir de algunas propiedades químicas y físicas medidas por máquina de ese lote.

Ajustar un modelo de random forest es exactamente igual que ajustar un modelo de regresión lineal generalizada, como hiciste en el capítulo anterior. Simplemente cambia el argumento method en la función train a "ranger". El paquete ranger es una reimplementación del clásico paquete randomForest de R y ajusta modelos mucho más rápido, pero ofrece prácticamente los mismos resultados. Recomendamos que todas las personas que empiezan usen el paquete ranger para modelado con random forest.

Este ejercicio forma parte del curso

Machine Learning con caret en R

Ver curso

Instrucciones del ejercicio

  • Entrena un random forest llamado model sobre el conjunto de datos de calidad del vino, wine, de forma que quality sea la variable respuesta y el resto de variables sean explicativas.
  • Usa method = "ranger".
  • Usa un tuneLength de 1.
  • Usa 5 pliegues de validación cruzada (CV).
  • Imprime model en la consola.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Fit random forest: model
model <- train(
  ___,
  tuneLength = ___,
  data = ___, 
  method = ___,
  trControl = trainControl(
    method = "cv", 
    number = ___, 
    verboseIter = TRUE
  )
)

# Print model to console
Editar y ejecutar código