ComenzarEmpieza gratis

Separa los conjuntos de entrenamiento y prueba

El primer paso para entrenar un modelo es dividir los datos en conjuntos de entrenamiento y de prueba. El paquete tidymodels lo hace sencillo. Reservar un conjunto de prueba te permite evaluar el modelo entrenado con datos que el modelo no ha visto antes.

Vas a usar los datos de rotación de personal del sector sanitario, que contienen información sobre empleados de una empresa de salud y si dejaron la empresa o no. Están disponibles en attrition_df. La variable objetivo es Attrition.

Los paquetes tidyverse y tidymodels ya se han cargado por ti.

Este ejercicio forma parte del curso

Reducción de la dimensionalidad en R

Ver curso

Instrucciones del ejercicio

  • Inicializa una partición de los datos con un 80% para entrenamiento y estratifica según Attrition, la variable objetivo.
  • Extrae el conjunto de entrenamiento y guárdalo en train.
  • Extrae el conjunto de prueba y guárdalo en test.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Initialize the split
split <- ___(___, ___ = ___, strata = ___)

# Extract training set
train <- ___ %>% ___()

# Extract testing set
test <- ___ %>% ___()
Editar y ejecutar código