CommencerCommencer gratuitement

Modèle de random forest

Dans cet exercice, vous allez utiliser la fonction randomForest() du package randomForest pour construire un modèle de random forest afin de prédire le churn des clients dans l’ensemble d’entraînement, training_set. La variable cible s’appelle Future. Vous examinerez également l’importance des variables dans le modèle et la visualiserez.

Cet exercice fait partie du cours

Analytique prédictive avec des données en réseau sous R

Afficher le cours

Instructions

  • Chargez le package randomForest.
  • Utilisez la fonction set.seed() avec la graine 863.
  • Construisez une random forest avec la fonction randomForest() en utilisant toutes les variables de training_set. La variable réponse Future doit être un facteur, utilisez donc la fonction as.factor().
  • Tracez l’importance des variables du modèle de random forest avec varImpPlot().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load package
___(randomForest)

# Set seed
set.seed(___)

# Build model
rfModel <- ___(as.factor(___)~. ,data=training_set)

# Plot variable importance
varImpPlot(___)
Modifier et exécuter le code