Random forest avec trainControl personnalisé
Un autre de mes modèles préférés est le random forest, qui combine un ensemble d’arbres de décision non linéaires pour obtenir un modèle très flexible (et souvent très précis).
Plutôt que d’utiliser le classique package randomForest, vous allez utiliser le package ranger, une ré-implémentation de randomForest qui produit pratiquement les mêmes résultats, mais est plus rapide, plus stable et consomme moins de mémoire. Je le recommande vivement comme point de départ pour modéliser des random forests en R.
Cet exercice fait partie du cours
Machine Learning avec caret en R
Instructions
churn_x et churn_y sont chargés dans votre espace de travail.
- Ajustez un modèle de random forest sur le jeu de données churn. Veillez à utiliser
myControlcommetrainControlcomme vous l’avez fait précédemment et à appliquer la méthode"ranger".
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit random forest: model_rf
model_rf <- train(
x = ___,
y = ___,
metric = "ROC",
method = ___,
trControl = ___
)