Adatta una random forest

Come hai visto nel video, i modelli di random forest sono molto più flessibili dei modelli lineari: sanno rappresentare effetti non lineari complessi e catturano automaticamente le interazioni tra variabili. In genere danno ottimi risultati su dati reali, quindi proviamone uno sul dataset della qualità del vino, dove l'obiettivo è prevedere la qualità valutata dall'uomo di un lotto di vino, a partire da alcune proprietà chimiche e fisiche del lotto misurate dalla macchina.

Adattare un modello di random forest è identico ad adattare un modello di regressione lineare generalizzata, come hai fatto nel capitolo precedente. Ti basta cambiare l'argomento method nella funzione train in "ranger". Il pacchetto ranger è una riscrittura del classico pacchetto randomForest di R e adatta i modelli molto più velocemente, fornendo quasi esattamente gli stessi risultati. Consigliamo a chi inizia di usare il pacchetto ranger per la modellazione con random forest.

Questo esercizio fa parte del corso

Machine Learning con caret in R

Visualizza il corso

Istruzioni dell'esercizio

Allena una random forest chiamata model sul dataset di qualità del vino, wine, in modo che quality sia la variabile di risposta e tutte le altre variabili siano variabili esplicative.
Usa method = "ranger".
Usa un tuneLength pari a 1.
Usa 5 fold di CV.
Stampa model nella console.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Fit random forest: model
model <- train(
  ___,
  tuneLength = ___,
  data = ___, 
  method = ___,
  trControl = trainControl(
    method = "cv", 
    number = ___, 
    verboseIter = TRUE
  )
)

# Print model to console

Modifica ed esegui il codice