Ajustando o modelo aos dados de treino
É hora de dividir seus dados em um conjunto de treino para ajustar um modelo e um teste separado para avaliar o poder preditivo do modelo. Antes de fazer essa divisão, porém, primeiro amostramos 100% das linhas de house_prices sem reposição e atribuimos isso a house_prices_shuffled. Isso tem o efeito de "embaralhar" as linhas, garantindo que os conjuntos de treino e teste sejam amostrados de forma aleatória.
Este exercício faz parte do curso
Modelagem com dados no Tidyverse
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set random number generator seed value for reproducibility
set.seed(76)
# Randomly reorder the rows
house_prices_shuffled <- house_prices %>%
sample_frac(size = 1, replace = FALSE)
# Train/test split
train <- house_prices_shuffled %>%
slice(___:___)
test <- house_prices_shuffled %>%
slice(___:___)