Normalisasi dan transformasi log
Anda menerima sebuah himpunan data, attrition_num, berisi data numerik tentang karyawan yang keluar dari perusahaan. Fitur mencakup
Age, DistanceFromHome, dan MonthlyRate.
Anda ingin menggunakan data ini untuk membangun model yang dapat memprediksi apakah seorang karyawan kemungkinan akan bertahan, ditandai oleh Attrition, sebuah variabel biner yang dikodekan sebagai factor. Sebagai persiapan pemodelan, Anda ingin mengurangi potensi kecondongan (skewness) dan mencegah beberapa variabel mendominasi yang lain karena perbedaan skala.
Data attrition_num serta pembagian train dan test telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur di R
Petunjuk latihan
- Normalisasi semua prediktor numerik.
- Terapkan transformasi log pada semua fitur numerik, dengan offset satu.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition~., data = train) %>%
# Normalize all numeric predictors
___(all_numeric_predictors()) %>%
# Log-transform all numeric features, with an offset of one
___(___, offset = ___)
lr_workflow <-
workflow() %>%
add_model(lr_model) %>%
add_recipe(lr_recipe)
lr_workflow