CommencerCommencer gratuitement

Validation croisée en 5 volets

Dans ce cours, vous utiliserez une grande variété de jeux de données pour explorer toute la flexibilité du package caret. Ici, vous allez travailler sur le célèbre jeu de données Boston housing, dont l’objectif est de prédire la valeur médiane des logements dans différents faubourgs de Boston.

Vous pouvez reprendre exactement le même code que dans l’exercice précédent, mais en changeant le jeu de données utilisé par le modèle :

model <- train(
  medv ~ ., 
  Boston, # <- nouveau !
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = 10,
    verboseIter = TRUE
  )
)

Ensuite, vous pouvez réduire le nombre de volets de la validation croisée de 10 à 5 à l’aide de l’argument number dans trainControl() :

trControl = trainControl(
  method = "cv", 
  number = 5,
  verboseIter = TRUE
)

Cet exercice fait partie du cours

Machine Learning avec caret en R

Afficher le cours

Instructions

  • Ajustez un modèle lm() sur le jeu de données Boston, avec medv comme variable réponse et toutes les autres variables comme variables explicatives.
  • Utilisez une validation croisée en 5 volets plutôt qu’en 10 volets.
  • Affichez le modèle dans la console et examinez les résultats.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Fit lm model using 5-fold CV: model
model <- train(
  ___, 
  ___,
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = ___,
    verboseIter = TRUE
  )
)

# Print model to console
Modifier et exécuter le code