MulaiMulai sekarang secara gratis

Mengimputasi nilai hilang dan membuat variabel dummy

Setelah mendeteksi nilai hilang dalam himpunan data attrition dan menentukan bahwa nilainya hilang sepenuhnya secara acak (MCAR), Anda memutuskan menggunakan imputasi K Nearest Neighbors (KNN). Saat mengonfigurasi recipe rekayasa fitur, Anda memutuskan untuk membuat variabel dummy untuk semua variabel nominal dan memperbarui peran variabel ...1 menjadi "ID" agar dapat Anda pertahankan dalam himpunan data sebagai referensi tanpa memengaruhi model Anda.

Latihan ini adalah bagian dari kursus

Rekayasa Fitur di R

Lihat Kursus

Petunjuk latihan

  • Perbarui peran ...1 menjadi "ID".
  • Imputasikan nilai pada semua prediktor yang memiliki data hilang.
  • Buat variabel dummy untuk semua prediktor nominal.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

lr_model <- logistic_reg()

lr_recipe <- 
  recipe(Attrition ~., data = train) %>%

# Update the role of "...1" to "ID"
  ___(...1, new_role = "ID" ) %>%

# Impute values to all predictors where data are missing
  step_impute_knn(___) %>%

# Create dummy variables for all nominal predictors
  ___(all_nominal_predictors())

lr_recipe
Edit dan Jalankan Kode