Separe os conjuntos de treino e teste
A primeira etapa ao treinar um modelo é dividir os dados em conjuntos de treino e teste. O pacote tidymodels facilita isso. Reservar um conjunto de teste permite avaliar o modelo treinado em dados que ele nunca viu.
Você usará os dados de evasão de colaboradores de uma empresa de saúde, que contêm informações sobre funcionários e se deixaram a empresa ou não. Eles estão disponíveis em attrition_df. A variável alvo é Attrition.
Os pacotes tidyverse e tidymodels já foram carregados para você.
Este exercício faz parte do curso
Redução de Dimensionalidade em R
Instruções do exercício
- Inicialize uma divisão dos dados com 80% para treino e estratifique com base em
Attrition, a variável alvo. - Extraia o conjunto de treino e armazene em
train. - Extraia o conjunto de teste e armazene em
test.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Initialize the split
split <- ___(___, ___ = ___, strata = ___)
# Extract training set
train <- ___ %>% ___()
# Extract testing set
test <- ___ %>% ___()