Créer des indices train/test personnalisés
Comme vous l’avez vu dans la vidéo, dans ce chapitre vous allez travailler sur un jeu de données réel qui rassemble tous les concepts abordés auparavant.
Le jeu de données churn regroupe des informations sur divers clients d’un opérateur télécom ; l’objectif de modélisation est de prédire quels clients résilieront leur abonnement (churn).
Dans ce chapitre, vous allez explorer deux types de modèles prédictifs : glmnet et rf. Première étape : créer un objet trainControl réutilisable pour pouvoir les comparer de manière fiable.
Cet exercice fait partie du cours
Machine Learning avec caret en R
Instructions
churn_x et churn_y sont chargés dans votre environnement.
- Utilisez
createFolds()pour créer 5 folds de CV surchurn_y, votre variable cible pour cet exercice. - Passez-les à
trainControl()pour créer untrainControlréutilisable pour comparer les modèles.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)
# Create reusable trainControl object: myControl
myControl <- trainControl(
summaryFunction = twoClassSummary,
classProbs = TRUE, # IMPORTANT!
verboseIter = TRUE,
savePredictions = TRUE,
index = ___
)