MulaiMulai sekarang secara gratis

Praproses

Saatnya feature engineering! Anda perlu membangun sebuah recipe untuk menangani variabel yang tidak informatif namun berpotensi bernilai seperti ID observasi, atau untuk menangani nilai hilang. Ini juga kesempatan untuk mentransformasi beberapa prediktor. Misalnya, menormalkan fitur numerik dan membuat variabel dummy untuk yang kategorikal.

Himpunan data attrition serta split train dan test yang Anda buat pada latihan sebelumnya tersedia di lingkungan Anda.

Latihan ini adalah bagian dari kursus

Rekayasa Fitur di R

Lihat Kursus

Petunjuk latihan

  • Normalkan semua fitur numerik.
  • Imputasikan nilai hilang menggunakan algoritme imputasi knn.
  • Buat variabel dummy untuk semua prediktor nominal.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

recipe <- recipe(Attrition ~ ., data = train) %>%
  update_role(...1, new_role = "ID") %>%

# Normalize all numeric features
  ___(all_numeric_predictors()) %>% 

# Impute missing values using the knn imputation algorithm
  ___(all_predictors()) %>%

# Create dummy variables for all nominal predictors
  ___(all_nominal_predictors())
 
recipe
Edit dan Jalankan Kode