Comece agoraComece grátis

Separe os conjuntos de treino e teste

A primeira etapa ao treinar um modelo é dividir os dados em conjuntos de treino e teste. O pacote tidymodels facilita isso. Reservar um conjunto de teste permite avaliar o modelo treinado em dados que ele nunca viu.

Você usará os dados de evasão de colaboradores de uma empresa de saúde, que contêm informações sobre funcionários e se deixaram a empresa ou não. Eles estão disponíveis em attrition_df. A variável alvo é Attrition.

Os pacotes tidyverse e tidymodels já foram carregados para você.

Este exercicio faz parte do curso

Redução de Dimensionalidade em R

Ver curso

Instruções do exercicio

  • Inicialize uma divisão dos dados com 80% para treino e estratifique com base em Attrition, a variável alvo.
  • Extraia o conjunto de treino e armazene em train.
  • Extraia o conjunto de teste e armazene em test.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Initialize the split
split <- ___(___, ___ = ___, strata = ___)

# Extract training set
train <- ___ %>% ___()

# Extract testing set
test <- ___ %>% ___()
Editar e Executar Código