ComeçarComece de graça

Validação cruzada 5-fold

Neste curso, você vai usar uma grande variedade de conjuntos de dados para explorar toda a flexibilidade do pacote caret. Aqui, você vai usar o famoso conjunto de dados de habitação de Boston, em que o objetivo é prever os valores medianos das casas em vários subúrbios de Boston.

Você pode usar exatamente o mesmo código do exercício anterior, mas alterando o conjunto de dados usado pelo modelo:

model <- train(
  medv ~ ., 
  Boston, # <- novo!
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = 10,
    verboseIter = TRUE
  )
)

Em seguida, você pode reduzir o número de folds da validação cruzada de 10 para 5 usando o argumento number da função trainControl():

trControl = trainControl(
  method = "cv", 
  number = 5,
  verboseIter = TRUE
)

Este exercício faz parte do curso

Machine Learning com caret em R

Ver curso

Instruções do exercício

  • Ajuste um modelo lm() ao conjunto de dados Boston, de forma que medv seja a variável resposta e todas as outras sejam variáveis explicativas.
  • Use validação cruzada 5-fold em vez de 10-fold.
  • Imprima o modelo no console e examine os resultados.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Fit lm model using 5-fold CV: model
model <- train(
  ___, 
  ___,
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = ___,
    verboseIter = TRUE
  )
)

# Print model to console
Editar e executar o código