Creación de conjuntos de entrenamiento y prueba
El paquete rsample está diseñado para crear conjuntos de entrenamiento y prueba. Crear un conjunto de prueba es importante para estimar cómo probablemente rendirá un modelo entrenado con datos nuevos. También protege frente al sobreajuste, cuando un modelo memoriza patrones que solo existen en los datos de entrenamiento y rinde mal con datos no vistos.
En este ejercicio, vas a crear conjuntos de entrenamiento y prueba a partir de los datos home_sales. Estos datos contienen información sobre viviendas vendidas en el área de Seattle, Washington, entre 2015 y 2016.
La variable objetivo en estos datos es selling_price.
El paquete tidymodels estará precargado en cada ejercicio del curso. El tibble home_sales también se ha cargado por ti.
Este ejercicio forma parte del curso
Modelado con tidymodels en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a data split object
home_split <- ___(home_sales,
prop = ___,
strata = ___)