Mengimputasi nilai hilang dan membuat variabel dummy
Setelah mendeteksi nilai hilang dalam himpunan data attrition dan menentukan bahwa nilainya hilang sepenuhnya secara acak (MCAR), Anda memutuskan menggunakan imputasi K Nearest Neighbors (KNN). Saat mengonfigurasi recipe rekayasa fitur, Anda memutuskan untuk membuat variabel dummy untuk semua variabel nominal dan memperbarui peran variabel ...1 menjadi "ID" agar dapat Anda pertahankan dalam himpunan data sebagai referensi tanpa memengaruhi model Anda.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur di R
Petunjuk latihan
- Perbarui peran
...1menjadi "ID". - Imputasikan nilai pada semua prediktor yang memiliki data hilang.
- Buat variabel dummy untuk semua prediktor nominal.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition ~., data = train) %>%
# Update the role of "...1" to "ID"
___(...1, new_role = "ID" ) %>%
# Impute values to all predictors where data are missing
step_impute_knn(___) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
lr_recipe