ComeçarComece de graça

Crie as dobras

Dividir os dados apenas uma vez em conjuntos de treino e teste traz inseguranças estatísticas — há uma pequena chance de o seu conjunto de teste conter apenas amostras com notas altas, enquanto todas as notas baixas ficam no conjunto de treino. Isso também significa que você só consegue medir o desempenho do seu modelo uma única vez.

A validação cruzada oferece uma estimativa mais robusta do desempenho fora da amostra, sem essas armadilhas estatísticas — ela avalia seu modelo de forma mais profunda.

Neste exercício, você vai criar dobras do seu conjunto de treino chocolate_train, que já está pré-carregado.

Este exercício faz parte do curso

Machine Learning com modelos baseados em árvores em R

Ver curso

Instruções do exercício

  • Defina a semente como 20 para reprodutibilidade.
  • Crie 10 dobras de chocolate_train e salve o resultado como chocolate_folds.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Set seed for reproducibility
___

# Build 10 folds
chocolate_folds <- ___(___, v = ___)

print(chocolate_folds)
Editar e executar o código