ComenzarEmpieza gratis

Filtrar la importancia de variables

El conjunto de datos attrition contiene 839 observaciones y 30 predictores para "Attrition". Te interesa explorar la compensación entre el rendimiento de un modelo que usa todos los predictores disponibles frente a un modelo reducido basado en unas pocas variables informativas.

En este ejercicio, ajustarás un modelo y revisarás la importancia de variables de ese modelo ajustado. En el siguiente ejercicio, evaluarás el rendimiento del modelo usando este modelo en comparación con un modelo reducido.

Las particiones train y test y el paquete vip() están disponibles en tu entorno junto con un model de regresión logística predefinido.

Este ejercicio forma parte del curso

Ingeniería de características en R

Ver curso

Instrucciones del ejercicio

  • Crea una receta que modele Attrition usando todos los predictores.
  • Ajusta el workflow con los datos de entrenamiento.
  • Usa el objeto fit_full para graficar la importancia de variables de tu modelo.
  • Aplica la función extract_fit_parsnip() antes de vip() para proporcionarle la información necesaria.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a recipe that models Attrition using all the predictors
recipe_full <- ___(___, data = train)

workflow_full <- workflow() %>%
  add_model(model) %>%
  add_recipe(recipe_full)

# Fit the workflow to the training data
fit_full <- ___ %>%
  ___(data = train)

# Use the fit_full object to graph the variable importance of your model. Apply extract_fit_parsnip() function before vip()
fit_full %>% ___() %>%
  ___(aesthetics = list(fill = "steelblue"))
Editar y ejecutar código