Separa los conjuntos de entrenamiento y prueba
El primer paso para entrenar un modelo es dividir los datos en conjuntos de entrenamiento y de prueba. El paquete tidymodels lo hace sencillo. Reservar un conjunto de prueba te permite evaluar el modelo entrenado con datos que el modelo no ha visto antes.
Vas a usar los datos de rotación de personal del sector sanitario, que contienen información sobre empleados de una empresa de salud y si dejaron la empresa o no. Están disponibles en attrition_df. La variable objetivo es Attrition.
Los paquetes tidyverse y tidymodels ya se han cargado por ti.
Este ejercicio forma parte del curso
Reducción de la dimensionalidad en R
Instrucciones del ejercicio
- Inicializa una partición de los datos con un 80% para entrenamiento y estratifica según
Attrition, la variable objetivo. - Extrae el conjunto de entrenamiento y guárdalo en
train. - Extrae el conjunto de prueba y guárdalo en
test.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Initialize the split
split <- ___(___, ___ = ___, strata = ___)
# Extract training set
train <- ___ %>% ___()
# Extract testing set
test <- ___ %>% ___()