Do zero ao avançado
Você dominou as habilidades de criar uma especificação de modelo e dividir os dados em conjuntos de treino e teste. Você também sabe como evitar desequilíbrios de classe na divisão. Agora é hora de juntar o que você aprendeu na lição anterior e construir seu modelo usando apenas o conjunto de treino!
Você vai montar um verdadeiro machine learning pipeline. Isso envolve criar uma especificação de modelo, dividir seus dados em conjuntos de treino e teste e, por último, mas não menos importante, ajustar os dados de treino a um modelo. Aproveite!
Este exercício faz parte do curso
Machine Learning com modelos baseados em árvores em R
Instruções do exercício
- Crie
diabetes_split, uma divisão em que o conjunto de treino contenha três quartos de todas as linhas dediabetese em que os conjuntos de treino e teste tenham distribuição semelhante na variáveloutcome. - Construa uma especificação de árvore de decisão para seu modelo usando o engine
rparte salve comotree_spec. - Ajuste um modelo
model_trainedusando os dados de treino dediabetes_split, comoutcomecomo variável-alvo ebmieskin_thicknesscomo preditores.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
set.seed(9)
# Create the balanced data split
diabetes_split <- ___
# Build the specification of the model
tree_spec <- ___ %>%
___ %>%
___
# Train the model
model_trained <- ___ %>%
fit(___,
___)
model_trained