CommencerCommencer gratuitement

Validation croisée 5 x 5 plis

Vous pouvez aller au-delà d’une seule itération de validation croisée. La validation croisée répétée fournit une meilleure estimation de l’erreur sur l’ensemble de test. Vous pouvez également répéter toute la procédure de validation croisée. C’est plus long, mais cela vous donne beaucoup plus d’ensembles hors échantillon à analyser et des évaluations bien plus précises des performances du modèle.

L’un des grands atouts de la fonction train() de caret est la facilité avec laquelle vous pouvez lancer des modèles très différents ou des méthodes de validation croisée en ajustant simplement quelques arguments dans l’appel de fonction. Par exemple, vous pourriez répéter toute votre procédure de validation croisée 5 fois pour avoir davantage confiance dans vos estimations des performances hors échantillon du modèle :

trControl = trainControl(
  method = "repeatedcv", 
  number = 5,
  repeats = 5, 
  verboseIter = TRUE
)

Cet exercice fait partie du cours

Machine Learning avec caret en R

Afficher le cours

Instructions

  • Ré-entraînez le modèle de régression linéaire sur le jeu de données Boston.
  • Utilisez 5 répétitions d’une validation croisée à 5 plis.
  • Affichez le modèle dans la console.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Fit lm model using 5 x 5-fold CV: model
model <- train(
  medv ~ ., 
  Boston,
  method = "lm",
  trControl = trainControl(
    method = "repeatedcv", 
    number = ___,
    repeats = ___, 
    verboseIter = TRUE
  )
)

# Print model to console
Modifier et exécuter le code