Menelusuri kepentingan variabel
Himpunan data attrition berisi 839 observasi dan 30 prediktor untuk "Attrition." Anda ingin menelaah kompromi antara kinerja model yang menggunakan semua prediktor yang tersedia dibandingkan model tereduksi yang berbasis pada beberapa variabel informatif.
Pada latihan ini, Anda akan melakukan fitting model dan meninjau kepentingan variabel dari model yang telah di-fit. Pada latihan berikutnya, Anda akan menilai kinerja model ini dibandingkan dengan model tereduksi.
Split train dan test serta paket vip() tersedia di lingkungan Anda bersama sebuah model regresi logistik yang telah dideklarasikan sebelumnya.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur di R
Petunjuk latihan
- Buat sebuah recipe yang memodelkan
Attritionmenggunakan semua prediktor. - Fit workflow ke data pelatihan.
- Gunakan objek
fit_fulluntuk membuat grafik kepentingan variabel dari model Anda. - Terapkan fungsi
extract_fit_parsnip()sebelumvip()agar menyediakan informasi yang diperlukan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a recipe that models Attrition using all the predictors
recipe_full <- ___(___, data = train)
workflow_full <- workflow() %>%
add_model(model) %>%
add_recipe(recipe_full)
# Fit the workflow to the training data
fit_full <- ___ %>%
___(data = train)
# Use the fit_full object to graph the variable importance of your model. Apply extract_fit_parsnip() function before vip()
fit_full %>% ___() %>%
___(aesthetics = list(fill = "steelblue"))