IniziaInizia gratis

Setacciare l'importanza delle variabili

Il dataset attrition contiene 839 osservazioni e 30 predittori per "Attrition". Vuoi esplorare il compromesso tra le prestazioni di un modello che usa tutti i predittori disponibili e quelle di un modello ridotto basato su poche variabili informative.

In questo esercizio, eseguirai il fit di un modello e osserverai l'importanza delle variabili del modello addestrato. Nell'esercizio successivo, valuterai le prestazioni confrontando questo modello con un modello ridotto.

Gli split train e test e il pacchetto vip() sono disponibili nel tuo ambiente insieme a un modello di regressione logistica model già dichiarato.

Questo esercizio fa parte del corso

Feature Engineering in R

Visualizza il corso

Istruzioni dell'esercizio

  • Crea una recipe che modelli Attrition usando tutti i predittori.
  • Esegui il fit del workflow sui dati di training.
  • Usa l'oggetto fit_full per tracciare l'importanza delle variabili del tuo modello.
  • Applica la funzione extract_fit_parsnip() prima di vip() per fornirgli le informazioni richieste.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a recipe that models Attrition using all the predictors
recipe_full <- ___(___, data = train)

workflow_full <- workflow() %>%
  add_model(model) %>%
  add_recipe(recipe_full)

# Fit the workflow to the training data
fit_full <- ___ %>%
  ___(data = train)

# Use the fit_full object to graph the variable importance of your model. Apply extract_fit_parsnip() function before vip()
fit_full %>% ___() %>%
  ___(aesthetics = list(fill = "steelblue"))
Modifica ed esegui il codice