MulaiMulai sekarang secara gratis

Menelusuri kepentingan variabel

Himpunan data attrition berisi 839 observasi dan 30 prediktor untuk "Attrition." Anda ingin menelaah kompromi antara kinerja model yang menggunakan semua prediktor yang tersedia dibandingkan model tereduksi yang berbasis pada beberapa variabel informatif.

Pada latihan ini, Anda akan melakukan fitting model dan meninjau kepentingan variabel dari model yang telah di-fit. Pada latihan berikutnya, Anda akan menilai kinerja model ini dibandingkan dengan model tereduksi.

Split train dan test serta paket vip() tersedia di lingkungan Anda bersama sebuah model regresi logistik yang telah dideklarasikan sebelumnya.

Latihan ini adalah bagian dari kursus

Rekayasa Fitur di R

Lihat Kursus

Petunjuk latihan

  • Buat sebuah recipe yang memodelkan Attrition menggunakan semua prediktor.
  • Fit workflow ke data pelatihan.
  • Gunakan objek fit_full untuk membuat grafik kepentingan variabel dari model Anda.
  • Terapkan fungsi extract_fit_parsnip() sebelum vip() agar menyediakan informasi yang diperlukan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a recipe that models Attrition using all the predictors
recipe_full <- ___(___, data = train)

workflow_full <- workflow() %>%
  add_model(model) %>%
  add_recipe(recipe_full)

# Fit the workflow to the training data
fit_full <- ___ %>%
  ___(data = train)

# Use the fit_full object to graph the variable importance of your model. Apply extract_fit_parsnip() function before vip()
fit_full %>% ___() %>%
  ___(aesthetics = list(fill = "steelblue"))
Edit dan Jalankan Kode