CommencerCommencer gratuitement

Créer des indices train/test personnalisés

Comme vous l’avez vu dans la vidéo, dans ce chapitre vous allez travailler sur un jeu de données réel qui rassemble tous les concepts abordés auparavant.

Le jeu de données churn regroupe des informations sur divers clients d’un opérateur télécom ; l’objectif de modélisation est de prédire quels clients résilieront leur abonnement (churn).

Dans ce chapitre, vous allez explorer deux types de modèles prédictifs : glmnet et rf. Première étape : créer un objet trainControl réutilisable pour pouvoir les comparer de manière fiable.

Cet exercice fait partie du cours

Machine Learning avec caret en R

Afficher le cours

Instructions

churn_x et churn_y sont chargés dans votre environnement.

  • Utilisez createFolds() pour créer 5 folds de CV sur churn_y, votre variable cible pour cet exercice.
  • Passez-les à trainControl() pour créer un trainControl réutilisable pour comparer les modèles.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)

# Create reusable trainControl object: myControl
myControl <- trainControl(
  summaryFunction = twoClassSummary,
  classProbs = TRUE, # IMPORTANT!
  verboseIter = TRUE,
  savePredictions = TRUE,
  index = ___
)
Modifier et exécuter le code