Crea un flujo de trabajo de receta y modelo
El paquete tidymodels puede combinar recetas y modelos en flujos de trabajo. Los flujos de trabajo facilitan crear una cadena de pasos para preparar los datos y entrenar modelos. Después, se pueden aplicar fácilmente a datos nuevos sin tener que redefinir todo el preprocesamiento y la construcción del modelo. Además, los flujos de trabajo tienen una función fit() que ajusta tanto la receta como el modelo a los datos.
En este ejercicio, practicarás cómo crear una receta y un modelo y añadirlos a un flujo de trabajo, para que queden listos para ajustarse a los datos. Los conjuntos train y test del conjunto de datos de rotación en seguros médicos para empleados están disponibles para que los uses. La variable objetivo es Attrition.
Los paquetes tidyverse y tidymodels ya están cargados.
Este ejercicio forma parte del curso
Reducción de la dimensionalidad en R
Instrucciones del ejercicio
- Define una receta usando los datos de
trainconstep_filter_missing(),step_scale()ystep_nzv()para eliminar NAs, escalar las variables numéricas y eliminar las variables de baja varianza, respectivamente. Usa un umbral de 0.5 parastep_filter_missing(). - Define un modelo de regresión logística usando el motor "glm".
- Añade
feature_selection_recipeylr_modela un flujo de trabajo llamadoattrition_wflow.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create recipe
feature_selection_recipe <-
___(___ ~ ., data = ___) %>%
___(___(), threshold = 0.5) %>%
___(___()) %>%
___(___()) %>%
prep()
# Create model
lr_model <- ___() %>%
___("___")
# Add recipe and model to a workflow
attrition_wflow <- ___() %>%
___(___) %>%
___(___)