MulaiMulai sekarang secara gratis

Normalisasi dan transformasi log

Anda menerima sebuah himpunan data, attrition_num, berisi data numerik tentang karyawan yang keluar dari perusahaan. Fitur mencakup Age, DistanceFromHome, dan MonthlyRate.

Anda ingin menggunakan data ini untuk membangun model yang dapat memprediksi apakah seorang karyawan kemungkinan akan bertahan, ditandai oleh Attrition, sebuah variabel biner yang dikodekan sebagai factor. Sebagai persiapan pemodelan, Anda ingin mengurangi potensi kecondongan (skewness) dan mencegah beberapa variabel mendominasi yang lain karena perbedaan skala.

Data attrition_num serta pembagian train dan test telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Rekayasa Fitur di R

Lihat Kursus

Petunjuk latihan

  • Normalisasi semua prediktor numerik.
  • Terapkan transformasi log pada semua fitur numerik, dengan offset satu.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

lr_model <- logistic_reg()

lr_recipe <- 
  recipe(Attrition~., data = train) %>%

# Normalize all numeric predictors
  ___(all_numeric_predictors()) %>%

# Log-transform all numeric features, with an offset of one
  ___(___, offset = ___)

lr_workflow <- 
  workflow() %>%
  add_model(lr_model) %>%
  add_recipe(lr_recipe)

lr_workflow
Edit dan Jalankan Kode