Normalisasi dan transformasi log
Anda menerima sebuah himpunan data, attrition_num, berisi data numerik tentang karyawan yang keluar dari perusahaan. Fitur mencakup
Age, DistanceFromHome, dan MonthlyRate.
Anda ingin menggunakan data ini untuk membangun model yang dapat memprediksi apakah seorang karyawan kemungkinan akan bertahan, ditandai oleh Attrition, sebuah variabel biner yang dikodekan sebagai factor. Sebagai persiapan pemodelan, Anda ingin mengurangi potensi kecondongan (skewness) dan mencegah beberapa variabel mendominasi yang lain karena perbedaan skala.
Data attrition_num serta pembagian train dan test telah dimuat untuk Anda.
Latihan ini merupakan bagian dari kursus
Rekayasa Fitur di R
Instruksi latihan
- Normalisasi semua prediktor numerik.
- Terapkan transformasi log pada semua fitur numerik, dengan offset satu.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition~., data = train) %>%
# Normalize all numeric predictors
___(all_numeric_predictors()) %>%
# Log-transform all numeric features, with an offset of one
___(___, offset = ___)
lr_workflow <-
workflow() %>%
add_model(lr_model) %>%
add_recipe(lr_recipe)
lr_workflow