ComenzarEmpieza gratis

Crea un flujo de trabajo de receta y modelo

El paquete tidymodels puede combinar recetas y modelos en flujos de trabajo. Los flujos de trabajo facilitan crear una cadena de pasos para preparar los datos y entrenar modelos. Después, se pueden aplicar fácilmente a datos nuevos sin tener que redefinir todo el preprocesamiento y la construcción del modelo. Además, los flujos de trabajo tienen una función fit() que ajusta tanto la receta como el modelo a los datos.

En este ejercicio, practicarás cómo crear una receta y un modelo y añadirlos a un flujo de trabajo, para que queden listos para ajustarse a los datos. Los conjuntos train y test del conjunto de datos de rotación en seguros médicos para empleados están disponibles para que los uses. La variable objetivo es Attrition.

Los paquetes tidyverse y tidymodels ya están cargados.

Este ejercicio forma parte del curso

Reducción de la dimensionalidad en R

Ver curso

Instrucciones del ejercicio

  • Define una receta usando los datos de train con step_filter_missing(), step_scale() y step_nzv() para eliminar NAs, escalar las variables numéricas y eliminar las variables de baja varianza, respectivamente. Usa un umbral de 0.5 para step_filter_missing().
  • Define un modelo de regresión logística usando el motor "glm".
  • Añade feature_selection_recipe y lr_model a un flujo de trabajo llamado attrition_wflow.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create recipe
feature_selection_recipe <- 
  ___(___ ~ ., data = ___) %>% 
  ___(___(), threshold = 0.5) %>% 
  ___(___()) %>% 
  ___(___()) %>% 
  prep()
  
# Create model
lr_model <- ___() %>% 
  ___("___")

# Add recipe and model to a workflow
attrition_wflow <- ___() %>% 
  ___(___) %>% 
  ___(___)
Editar y ejecutar código