ComeçarComece de graça

Separe os conjuntos de treino e teste

A primeira etapa ao treinar um modelo é dividir os dados em conjuntos de treino e teste. O pacote tidymodels facilita isso. Reservar um conjunto de teste permite avaliar o modelo treinado em dados que ele nunca viu.

Você usará os dados de evasão de colaboradores de uma empresa de saúde, que contêm informações sobre funcionários e se deixaram a empresa ou não. Eles estão disponíveis em attrition_df. A variável alvo é Attrition.

Os pacotes tidyverse e tidymodels já foram carregados para você.

Este exercício faz parte do curso

Redução de Dimensionalidade em R

Ver curso

Instruções do exercício

  • Inicialize uma divisão dos dados com 80% para treino e estratifique com base em Attrition, a variável alvo.
  • Extraia o conjunto de treino e armazene em train.
  • Extraia o conjunto de teste e armazene em test.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Initialize the split
split <- ___(___, ___ = ___, strata = ___)

# Extract training set
train <- ___ %>% ___()

# Extract testing set
test <- ___ %>% ___()
Editar e executar o código