Validation croisée 5 x 5 plis
Vous pouvez aller au-delà d’une seule itération de validation croisée. La validation croisée répétée fournit une meilleure estimation de l’erreur sur l’ensemble de test. Vous pouvez également répéter toute la procédure de validation croisée. C’est plus long, mais cela vous donne beaucoup plus d’ensembles hors échantillon à analyser et des évaluations bien plus précises des performances du modèle.
L’un des grands atouts de la fonction train() de caret est la facilité avec laquelle vous pouvez lancer des modèles très différents ou des méthodes de validation croisée en ajustant simplement quelques arguments dans l’appel de fonction. Par exemple, vous pourriez répéter toute votre procédure de validation croisée 5 fois pour avoir davantage confiance dans vos estimations des performances hors échantillon du modèle :
trControl = trainControl(
method = "repeatedcv",
number = 5,
repeats = 5,
verboseIter = TRUE
)
Cet exercice fait partie du cours
Machine Learning avec caret en R
Instructions
- Ré-entraînez le modèle de régression linéaire sur le jeu de données
Boston. - Utilisez 5 répétitions d’une validation croisée à 5 plis.
- Affichez le modèle dans la console.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit lm model using 5 x 5-fold CV: model
model <- train(
medv ~ .,
Boston,
method = "lm",
trControl = trainControl(
method = "repeatedcv",
number = ___,
repeats = ___,
verboseIter = TRUE
)
)
# Print model to console