Crie as dobras
Dividir os dados apenas uma vez em conjuntos de treino e teste traz inseguranças estatísticas — há uma pequena chance de o seu conjunto de teste conter apenas amostras com notas altas, enquanto todas as notas baixas ficam no conjunto de treino. Isso também significa que você só consegue medir o desempenho do seu modelo uma única vez.
A validação cruzada oferece uma estimativa mais robusta do desempenho fora da amostra, sem essas armadilhas estatísticas — ela avalia seu modelo de forma mais profunda.
Neste exercício, você vai criar dobras do seu conjunto de treino chocolate_train, que já está pré-carregado.
Este exercício faz parte do curso
Machine Learning com modelos baseados em árvores em R
Instruções do exercício
- Defina a semente como 20 para reprodutibilidade.
- Crie 10 dobras de
chocolate_traine salve o resultado comochocolate_folds.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set seed for reproducibility
___
# Build 10 folds
chocolate_folds <- ___(___, v = ___)
print(chocolate_folds)