Ajustar um random forest
Como você viu no vídeo, modelos de random forest são muito mais flexíveis do que modelos lineares e conseguem modelar efeitos não lineares complexos, além de capturar automaticamente interações entre variáveis. Eles costumam trazer resultados muito bons em dados do mundo real, então vamos testar um no conjunto de dados de qualidade de vinhos, onde o objetivo é prever a qualidade avaliada por humanos de um lote de vinho, dadas algumas propriedades químicas e físicas medidas por máquinas desse lote.
Ajustar um modelo de random forest é exatamente igual a ajustar um modelo de regressão linear generalizada, como você fez no capítulo anterior. Você só precisa mudar o argumento method na função train para "ranger". O pacote ranger é uma reescrita do clássico pacote randomForest do R e ajusta modelos muito mais rapidamente, mas entrega praticamente os mesmos resultados. Recomendamos que todas as pessoas iniciantes usem o pacote ranger para modelagem com random forest.
Este exercício faz parte do curso
Machine Learning com caret em R
Instruções do exercício
- Treine um random forest chamado
modelno conjunto de dados de qualidade de vinhos,wine, de modo quequalityseja a variável resposta e todas as demais sejam variáveis explicativas. - Use
method = "ranger". - Use
tuneLengthigual a 1. - Use 5 dobras de CV.
- Imprima
modelno console.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit random forest: model
model <- train(
___,
tuneLength = ___,
data = ___,
method = ___,
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console