EmpezarEmpieza gratis

Ajustar el modelo a los datos de entrenamiento

Es hora de dividir tus datos en un conjunto de entrenamiento para ajustar un modelo y un conjunto de prueba independiente para evaluar su poder predictivo. Antes de hacer esta división, primero muestreamos el 100% de las filas de house_prices sin reemplazo y lo asignamos a house_prices_shuffled. Esto tiene el efecto de "barajar" las filas, garantizando así que los conjuntos de entrenamiento y prueba se muestren de forma aleatoria.

Este ejercicio forma parte del curso

Modelado con datos en el Tidyverse

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Set random number generator seed value for reproducibility
set.seed(76)

# Randomly reorder the rows
house_prices_shuffled <- house_prices %>% 
  sample_frac(size = 1, replace = FALSE)

# Train/test split
train <- house_prices_shuffled %>%
  slice(___:___)
test <- house_prices_shuffled %>%
  slice(___:___)
Editar y ejecutar código