In der Variablenwichtigkeit stöbern
Der Datensatz attrition enthält 839 Beobachtungen und 30 Prädiktoren für „Attrition“. Du möchtest den Trade-off zwischen der Performance eines Modells mit allen verfügbaren Prädiktoren und eines reduzierten Modells mit wenigen informativen Variablen untersuchen.
In dieser Übung passt du ein Modell an und schaust dir die Variablenwichtigkeit dieses angepassten Modells an. In der nächsten Übung bewertest du die Modellgüte dieses Modells im Vergleich zu einem reduzierten Modell.
Die Splits train und test sowie das Paket vip() stehen dir in deiner Umgebung zur Verfügung, zusammen mit einem vordefinierten logistischen Regressions-model.
Diese Übung ist Teil des Kurses
Feature Engineering in R
Anleitung zur Übung
- Erstelle ein Rezept, das
Attritionmit allen Prädiktoren modelliert. - Fitte den Workflow auf die Trainingsdaten.
- Verwende das Objekt
fit_full, um die Variablenwichtigkeit deines Modells zu visualisieren. - Wende vor
vip()die Funktionextract_fit_parsnip()an, um die benötigten Informationen zu übergeben.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a recipe that models Attrition using all the predictors
recipe_full <- ___(___, data = train)
workflow_full <- workflow() %>%
add_model(model) %>%
add_recipe(recipe_full)
# Fit the workflow to the training data
fit_full <- ___ %>%
___(data = train)
# Use the fit_full object to graph the variable importance of your model. Apply extract_fit_parsnip() function before vip()
fit_full %>% ___() %>%
___(aesthetics = list(fill = "steelblue"))