Garimpando a importância das variáveis
O conjunto de dados attrition contém 839 observações e 30 preditores para "Attrition". Você quer explorar o trade-off entre o desempenho de um modelo que usa todos os preditores disponíveis e o de um modelo reduzido baseado em poucas variáveis informativas.
Neste exercício, você vai ajustar um modelo e visualizar a importância das variáveis desse modelo ajustado. No exercício seguinte, você avaliará o desempenho do modelo completo em comparação com um modelo reduzido.
Os splits train e test e o pacote vip() estão disponíveis no seu ambiente, junto com um model de regressão logística previamente declarado.
Este exercício faz parte do curso
Feature Engineering em R
Instruções do exercício
- Crie uma recipe que modele
Attritionusando todos os preditores. - Ajuste o workflow aos dados de treino.
- Use o objeto
fit_fullpara gerar o gráfico de importância das variáveis do seu modelo. - Aplique a função
extract_fit_parsnip()antes devip()para fornecer as informações necessárias.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a recipe that models Attrition using all the predictors
recipe_full <- ___(___, data = train)
workflow_full <- workflow() %>%
add_model(model) %>%
add_recipe(recipe_full)
# Fit the workflow to the training data
fit_full <- ___ %>%
___(data = train)
# Use the fit_full object to graph the variable importance of your model. Apply extract_fit_parsnip() function before vip()
fit_full %>% ___() %>%
___(aesthetics = list(fill = "steelblue"))