Validation croisée en 5 volets
Dans ce cours, vous utiliserez une grande variété de jeux de données pour explorer toute la flexibilité du package caret. Ici, vous allez travailler sur le célèbre jeu de données Boston housing, dont l’objectif est de prédire la valeur médiane des logements dans différents faubourgs de Boston.
Vous pouvez reprendre exactement le même code que dans l’exercice précédent, mais en changeant le jeu de données utilisé par le modèle :
model <- train(
medv ~ .,
Boston, # <- nouveau !
method = "lm",
trControl = trainControl(
method = "cv",
number = 10,
verboseIter = TRUE
)
)
Ensuite, vous pouvez réduire le nombre de volets de la validation croisée de 10 à 5 à l’aide de l’argument number dans trainControl() :
trControl = trainControl(
method = "cv",
number = 5,
verboseIter = TRUE
)
Cet exercice fait partie du cours
Machine Learning avec caret en R
Instructions
- Ajustez un modèle
lm()sur le jeu de donnéesBoston, avecmedvcomme variable réponse et toutes les autres variables comme variables explicatives. - Utilisez une validation croisée en 5 volets plutôt qu’en 10 volets.
- Affichez le modèle dans la console et examinez les résultats.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit lm model using 5-fold CV: model
model <- train(
___,
___,
method = "lm",
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console