Divisão treino/teste
Para testar seus modelos, você precisa ajustar e avaliar o modelo em duas partes diferentes dos dados — caso contrário, é como colar na prova (já que você já sabe as respostas).
A divisão dos dados é uma parte essencial do processo de modelagem. Você vai praticar isso dividindo os dados de diabetes e confirmando as proporções da divisão.
Os dados diabetes do último exercício já estão pré-carregados no seu ambiente de trabalho.
Este exercício faz parte do curso
Machine Learning com modelos baseados em árvores em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the split
diabetes_split <- ___(___, prop = ___)
# Print the data split
___