Criando conjuntos de dados de treino e teste
O pacote rsample foi criado para gerar conjuntos de dados de treino e teste. Criar um conjunto de teste é importante para estimar como um modelo treinado provavelmente vai se sair com novos dados. Isso também ajuda a evitar overfitting, quando o modelo decora padrões que existem só nos dados de treino e tem um desempenho ruim em dados novos.
Neste exercício, você vai criar conjuntos de treino e teste a partir dos dados home_sales. Esses dados reúnem informações sobre casas vendidas na região de Seattle, Washington, entre 2015 e 2016.
A variável de desfecho neste conjunto é selling_price.
O pacote tidymodels será pré-carregado em todos os exercícios do curso. O tibble home_sales também já foi carregado para você.
Este exercício faz parte do curso
Modelagem com tidymodels em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a data split object
home_split <- ___(home_sales,
prop = ___,
strata = ___)