Modèle de random forest
Dans cet exercice, vous allez utiliser la fonction randomForest() du package randomForest pour construire un modèle de random forest afin de prédire le churn des clients dans l’ensemble d’entraînement, training_set. La variable cible s’appelle Future.
Vous examinerez également l’importance des variables dans le modèle et la visualiserez.
Cet exercice fait partie du cours
Analytique prédictive avec des données en réseau sous R
Instructions
- Chargez le package
randomForest. - Utilisez la fonction
set.seed()avec la graine 863. - Construisez une random forest avec la fonction
randomForest()en utilisant toutes les variables detraining_set. La variable réponseFuturedoit être un facteur, utilisez donc la fonctionas.factor(). - Tracez l’importance des variables du modèle de random forest avec
varImpPlot().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load package
___(randomForest)
# Set seed
set.seed(___)
# Build model
rfModel <- ___(as.factor(___)~. ,data=training_set)
# Plot variable importance
varImpPlot(___)