ComeçarComece de graça

Ajustar um random forest

Como você viu no vídeo, modelos de random forest são muito mais flexíveis do que modelos lineares e conseguem modelar efeitos não lineares complexos, além de capturar automaticamente interações entre variáveis. Eles costumam trazer resultados muito bons em dados do mundo real, então vamos testar um no conjunto de dados de qualidade de vinhos, onde o objetivo é prever a qualidade avaliada por humanos de um lote de vinho, dadas algumas propriedades químicas e físicas medidas por máquinas desse lote.

Ajustar um modelo de random forest é exatamente igual a ajustar um modelo de regressão linear generalizada, como você fez no capítulo anterior. Você só precisa mudar o argumento method na função train para "ranger". O pacote ranger é uma reescrita do clássico pacote randomForest do R e ajusta modelos muito mais rapidamente, mas entrega praticamente os mesmos resultados. Recomendamos que todas as pessoas iniciantes usem o pacote ranger para modelagem com random forest.

Este exercício faz parte do curso

Machine Learning com caret em R

Ver curso

Instruções do exercício

  • Treine um random forest chamado model no conjunto de dados de qualidade de vinhos, wine, de modo que quality seja a variável resposta e todas as demais sejam variáveis explicativas.
  • Use method = "ranger".
  • Use tuneLength igual a 1.
  • Use 5 dobras de CV.
  • Imprima model no console.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Fit random forest: model
model <- train(
  ___,
  tuneLength = ___,
  data = ___, 
  method = ___,
  trControl = trainControl(
    method = "cv", 
    number = ___, 
    verboseIter = TRUE
  )
)

# Print model to console
Editar e executar o código