ComeçarComece de graça

Do zero ao avançado

Você dominou as habilidades de criar uma especificação de modelo e dividir os dados em conjuntos de treino e teste. Você também sabe como evitar desequilíbrios de classe na divisão. Agora é hora de juntar o que você aprendeu na lição anterior e construir seu modelo usando apenas o conjunto de treino!

Você vai montar um verdadeiro machine learning pipeline. Isso envolve criar uma especificação de modelo, dividir seus dados em conjuntos de treino e teste e, por último, mas não menos importante, ajustar os dados de treino a um modelo. Aproveite!

Este exercício faz parte do curso

Machine Learning com modelos baseados em árvores em R

Ver curso

Instruções do exercício

  • Crie diabetes_split, uma divisão em que o conjunto de treino contenha três quartos de todas as linhas de diabetes e em que os conjuntos de treino e teste tenham distribuição semelhante na variável outcome.
  • Construa uma especificação de árvore de decisão para seu modelo usando o engine rpart e salve como tree_spec.
  • Ajuste um modelo model_trained usando os dados de treino de diabetes_split, com outcome como variável-alvo e bmi e skin_thickness como preditores.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

set.seed(9)

# Create the balanced data split
diabetes_split <- ___

# Build the specification of the model
tree_spec <- ___ %>% 
  ___ %>% 
  ___

# Train the model
model_trained <- ___ %>% 
  fit(___, 
      ___)

model_trained
Editar e executar o código