Validação cruzada 5-fold
Neste curso, você vai usar uma grande variedade de conjuntos de dados para explorar toda a flexibilidade do pacote caret. Aqui, você vai usar o famoso conjunto de dados de habitação de Boston, em que o objetivo é prever os valores medianos das casas em vários subúrbios de Boston.
Você pode usar exatamente o mesmo código do exercício anterior, mas alterando o conjunto de dados usado pelo modelo:
model <- train(
medv ~ .,
Boston, # <- novo!
method = "lm",
trControl = trainControl(
method = "cv",
number = 10,
verboseIter = TRUE
)
)
Em seguida, você pode reduzir o número de folds da validação cruzada de 10 para 5 usando o argumento number da função trainControl():
trControl = trainControl(
method = "cv",
number = 5,
verboseIter = TRUE
)
Este exercício faz parte do curso
Machine Learning com caret em R
Instruções do exercício
- Ajuste um modelo
lm()ao conjunto de dadosBoston, de forma quemedvseja a variável resposta e todas as outras sejam variáveis explicativas. - Use validação cruzada 5-fold em vez de 10-fold.
- Imprima o modelo no console e examine os resultados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit lm model using 5-fold CV: model
model <- train(
___,
___,
method = "lm",
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console