Praproses
Saatnya feature engineering! Anda perlu membangun sebuah recipe untuk menangani variabel yang tidak informatif namun berpotensi bernilai seperti ID observasi, atau untuk menangani nilai hilang. Ini juga kesempatan untuk mentransformasi beberapa prediktor. Misalnya, menormalkan fitur numerik dan membuat variabel dummy untuk yang kategorikal.
Himpunan data attrition serta split train dan test yang Anda buat pada latihan sebelumnya tersedia di lingkungan Anda.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur di R
Petunjuk latihan
- Normalkan semua fitur numerik.
- Imputasikan nilai hilang menggunakan algoritme imputasi
knn. - Buat variabel dummy untuk semua prediktor nominal.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
recipe <- recipe(Attrition ~ ., data = train) %>%
update_role(...1, new_role = "ID") %>%
# Normalize all numeric features
___(all_numeric_predictors()) %>%
# Impute missing values using the knn imputation algorithm
___(all_predictors()) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
recipe