Adatta una random forest
Come hai visto nel video, i modelli di random forest sono molto più flessibili dei modelli lineari: sanno rappresentare effetti non lineari complessi e catturano automaticamente le interazioni tra variabili. In genere danno ottimi risultati su dati reali, quindi proviamone uno sul dataset della qualità del vino, dove l'obiettivo è prevedere la qualità valutata dall'uomo di un lotto di vino, a partire da alcune proprietà chimiche e fisiche del lotto misurate dalla macchina.
Adattare un modello di random forest è identico ad adattare un modello di regressione lineare generalizzata, come hai fatto nel capitolo precedente. Ti basta cambiare l'argomento method nella funzione train in "ranger". Il pacchetto ranger è una riscrittura del classico pacchetto randomForest di R e adatta i modelli molto più velocemente, fornendo quasi esattamente gli stessi risultati. Consigliamo a chi inizia di usare il pacchetto ranger per la modellazione con random forest.
Questo esercizio fa parte del corso
Machine Learning con caret in R
Istruzioni dell'esercizio
- Allena una random forest chiamata
modelsul dataset di qualità del vino,wine, in modo chequalitysia la variabile di risposta e tutte le altre variabili siano variabili esplicative. - Usa
method = "ranger". - Usa un
tuneLengthpari a 1. - Usa 5 fold di CV.
- Stampa
modelnella console.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit random forest: model
model <- train(
___,
tuneLength = ___,
data = ___,
method = ___,
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console