ComenzarEmpieza gratis

Ajustar el modelo a los datos de entrenamiento

Es hora de dividir tus datos en un conjunto de entrenamiento para ajustar un modelo y un conjunto de prueba independiente para evaluar su poder predictivo. Antes de hacer esta división, primero muestreamos el 100% de las filas de house_prices sin reemplazo y lo asignamos a house_prices_shuffled. Esto tiene el efecto de "barajar" las filas, garantizando así que los conjuntos de entrenamiento y prueba se muestren de forma aleatoria.

Este ejercicio forma parte del curso

Modelado con datos en el Tidyverse

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Set random number generator seed value for reproducibility
set.seed(76)

# Randomly reorder the rows
house_prices_shuffled <- house_prices %>% 
  sample_frac(size = 1, replace = FALSE)

# Train/test split
train <- house_prices_shuffled %>%
  slice(___:___)
test <- house_prices_shuffled %>%
  slice(___:___)
Editar y ejecutar código