ComeçarComece de graça

Criando conjuntos de dados de treino e teste

O pacote rsample foi criado para gerar conjuntos de dados de treino e teste. Criar um conjunto de teste é importante para estimar como um modelo treinado provavelmente vai se sair com novos dados. Isso também ajuda a evitar overfitting, quando o modelo decora padrões que existem só nos dados de treino e tem um desempenho ruim em dados novos.

Neste exercício, você vai criar conjuntos de treino e teste a partir dos dados home_sales. Esses dados reúnem informações sobre casas vendidas na região de Seattle, Washington, entre 2015 e 2016.

A variável de desfecho neste conjunto é selling_price.

O pacote tidymodels será pré-carregado em todos os exercícios do curso. O tibble home_sales também já foi carregado para você.

Este exercício faz parte do curso

Modelagem com tidymodels em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a data split object
home_split <- ___(home_sales, 
                  prop = ___, 
                  strata = ___)
Editar e executar o código