ComeçarComece de graça

Ajustando o modelo aos dados de treino

É hora de dividir seus dados em um conjunto de treino para ajustar um modelo e um teste separado para avaliar o poder preditivo do modelo. Antes de fazer essa divisão, porém, primeiro amostramos 100% das linhas de house_prices sem reposição e atribuimos isso a house_prices_shuffled. Isso tem o efeito de "embaralhar" as linhas, garantindo que os conjuntos de treino e teste sejam amostrados de forma aleatória.

Este exercício faz parte do curso

Modelagem com dados no Tidyverse

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Set random number generator seed value for reproducibility
set.seed(76)

# Randomly reorder the rows
house_prices_shuffled <- house_prices %>% 
  sample_frac(size = 1, replace = FALSE)

# Train/test split
train <- house_prices_shuffled %>%
  slice(___:___)
test <- house_prices_shuffled %>%
  slice(___:___)
Editar e executar o código