Divide los datos
En este ejercicio, vas a dividir tus datos en conjuntos de entrenamiento y de prueba usando el paquete caret. En las siguientes lecciones, usarás el conjunto de entrenamiento para construir modelos de regresión logística y el conjunto de prueba para validarlos.
Este ejercicio forma parte del curso
Analítica de RR. HH.: Predicción de la rotación de empleados en R
Instrucciones del ejercicio
- Carga el paquete
caret. - Fija la semilla en 567 y crea una partición que divida el conjunto
emp_finalen secciones entrenamiento/prueba del 70% / 30%. - Crea el conjunto de entrenamiento seleccionando los números de fila almacenados en
index_traindel conjuntoemp_final. - Asigna las observaciones restantes de
emp_finalal conjunto de prueba.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load caret
___
# Set seed of 567
___
# Store row numbers for training dataset: index_train
index_train <- ___(emp_final$turnover, p = ___, list = FALSE)
# Create training dataset: train_set
train_set <- emp_final[___, ]
# Create testing dataset: test_set
test_set <- emp_final[___, ]