Modello random forest
In questo esercizio userai la funzione randomForest() del pacchetto randomForest per costruire un modello random forest che predica il churn dei clienti nel training set training_set. La variabile target si chiama Future.
Esaminerai anche l’importanza delle variabili nel modello e la visualizzerai.
Questo esercizio fa parte del corso
Analitica predittiva con dati di rete in R
Istruzioni dell'esercizio
- Carica il pacchetto
randomForest. - Usa la funzione
set.seed()con seed 863. - Crea una random forest usando la funzione
randomForest()e tutte le variabili intraining_set. La variabile rispostaFuturedeve essere un fattore, quindi utilizza la funzioneas.factor(). - Traccia l’importanza delle variabili del modello random forest usando
varImpPlot().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load package
___(randomForest)
# Set seed
set.seed(___)
# Build model
rfModel <- ___(as.factor(___)~. ,data=training_set)
# Plot variable importance
varImpPlot(___)