ComeçarComece de graça

Garimpando a importância das variáveis

O conjunto de dados attrition contém 839 observações e 30 preditores para "Attrition". Você quer explorar o trade-off entre o desempenho de um modelo que usa todos os preditores disponíveis e o de um modelo reduzido baseado em poucas variáveis informativas.

Neste exercício, você vai ajustar um modelo e visualizar a importância das variáveis desse modelo ajustado. No exercício seguinte, você avaliará o desempenho do modelo completo em comparação com um modelo reduzido.

Os splits train e test e o pacote vip() estão disponíveis no seu ambiente, junto com um model de regressão logística previamente declarado.

Este exercício faz parte do curso

Feature Engineering em R

Ver curso

Instruções do exercício

  • Crie uma recipe que modele Attrition usando todos os preditores.
  • Ajuste o workflow aos dados de treino.
  • Use o objeto fit_full para gerar o gráfico de importância das variáveis do seu modelo.
  • Aplique a função extract_fit_parsnip() antes de vip() para fornecer as informações necessárias.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a recipe that models Attrition using all the predictors
recipe_full <- ___(___, data = train)

workflow_full <- workflow() %>%
  add_model(model) %>%
  add_recipe(recipe_full)

# Fit the workflow to the training data
fit_full <- ___ %>%
  ___(data = train)

# Use the fit_full object to graph the variable importance of your model. Apply extract_fit_parsnip() function before vip()
fit_full %>% ___() %>%
  ___(aesthetics = list(fill = "steelblue"))
Editar e executar o código