Filtrar la importancia de variables
El conjunto de datos attrition contiene 839 observaciones y 30 predictores para "Attrition". Te interesa explorar la compensación entre el rendimiento de un modelo que usa todos los predictores disponibles frente a un modelo reducido basado en unas pocas variables informativas.
En este ejercicio, ajustarás un modelo y revisarás la importancia de variables de ese modelo ajustado. En el siguiente ejercicio, evaluarás el rendimiento del modelo usando este modelo en comparación con un modelo reducido.
Las particiones train y test y el paquete vip() están disponibles en tu entorno junto con un model de regresión logística predefinido.
Este ejercicio forma parte del curso
Ingeniería de características en R
Instrucciones del ejercicio
- Crea una receta que modele
Attritionusando todos los predictores. - Ajusta el workflow con los datos de entrenamiento.
- Usa el objeto
fit_fullpara graficar la importancia de variables de tu modelo. - Aplica la función
extract_fit_parsnip()antes devip()para proporcionarle la información necesaria.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a recipe that models Attrition using all the predictors
recipe_full <- ___(___, data = train)
workflow_full <- workflow() %>%
add_model(model) %>%
add_recipe(recipe_full)
# Fit the workflow to the training data
fit_full <- ___ %>%
___(data = train)
# Use the fit_full object to graph the variable importance of your model. Apply extract_fit_parsnip() function before vip()
fit_full %>% ___() %>%
___(aesthetics = list(fill = "steelblue"))