Ajustar el modelo a los datos de entrenamiento
Es hora de dividir tus datos en un conjunto de entrenamiento para ajustar un modelo y un conjunto de prueba independiente para evaluar su poder predictivo. Antes de hacer esta división, primero muestreamos el 100% de las filas de house_prices sin reemplazo y lo asignamos a house_prices_shuffled. Esto tiene el efecto de "barajar" las filas, garantizando así que los conjuntos de entrenamiento y prueba se muestren de forma aleatoria.
Este ejercicio forma parte del curso
Modelado con datos en el Tidyverse
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set random number generator seed value for reproducibility
set.seed(76)
# Randomly reorder the rows
house_prices_shuffled <- house_prices %>%
sample_frac(size = 1, replace = FALSE)
# Train/test split
train <- house_prices_shuffled %>%
slice(___:___)
test <- house_prices_shuffled %>%
slice(___:___)