Transformasi Yeo-Johnson
Dengan menggunakan himpunan data attrition_num yang berisi seluruh data numerik tentang karyawan yang telah keluar dari perusahaan, Anda ingin membangun model yang dapat memprediksi apakah seorang karyawan cenderung tetap tinggal, menggunakan Attrition, variabel biner yang dikodekan sebagai factor. Untuk membuat fitur berperilaku hampir normal, Anda akan membuat sebuah recipe yang menerapkan transformasi Yeo-Johnson.
Data attrition_num, model regresi logistik lr_model, fungsi buatan pengguna class-evaluate(), serta pembagian train dan test telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur di R
Petunjuk latihan
- Buat recipe yang menggunakan Yeo-Johnson untuk mentransformasikan semua fitur numerik, termasuk target.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a recipe that uses Yeo-Johnson to transform all numeric features
lr_recipe_YJ <-
recipe(Attrition ~., data = train) %>%
___
lr_workflow_YJ <- workflow() %>%
add_model(lr_model) %>%
add_recipe(lr_recipe_YJ)
lr_fit_YJ <- lr_workflow_YJ %>%
fit(train)
lr_aug_YJ <-
lr_fit_YJ %>% augment(test)
lr_aug_YJ %>% class_evaluate(truth = Attrition,
estimate = .pred_class,.pred_No)