Setacciare l'importanza delle variabili
Il dataset attrition contiene 839 osservazioni e 30 predittori per "Attrition". Vuoi esplorare il compromesso tra le prestazioni di un modello che usa tutti i predittori disponibili e quelle di un modello ridotto basato su poche variabili informative.
In questo esercizio, eseguirai il fit di un modello e osserverai l'importanza delle variabili del modello addestrato. Nell'esercizio successivo, valuterai le prestazioni confrontando questo modello con un modello ridotto.
Gli split train e test e il pacchetto vip() sono disponibili nel tuo ambiente insieme a un modello di regressione logistica model già dichiarato.
Questo esercizio fa parte del corso
Feature Engineering in R
Istruzioni dell'esercizio
- Crea una recipe che modelli
Attritionusando tutti i predittori. - Esegui il fit del workflow sui dati di training.
- Usa l'oggetto
fit_fullper tracciare l'importanza delle variabili del tuo modello. - Applica la funzione
extract_fit_parsnip()prima divip()per fornirgli le informazioni richieste.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a recipe that models Attrition using all the predictors
recipe_full <- ___(___, data = train)
workflow_full <- workflow() %>%
add_model(model) %>%
add_recipe(recipe_full)
# Fit the workflow to the training data
fit_full <- ___ %>%
___(data = train)
# Use the fit_full object to graph the variable importance of your model. Apply extract_fit_parsnip() function before vip()
fit_full %>% ___() %>%
___(aesthetics = list(fill = "steelblue"))