Eksik değerleri atama ve kukla değişkenler oluşturma
attrition veri kümesinde eksik değerleri tespit edip bunların tamamen rastgele eksik (MCAR) olduğuna karar verdikten sonra, K En Yakın Komşu (KNN) atamasını kullanmaya karar veriyorsun. Özellik mühendisliği recipe’ını yapılandırırken, tüm ad nominal değişkenlerin için kukla değişkenler oluşturmayı ve ...1 değişkeninin rolünü "ID" olarak güncellemeyi seçiyorsun; böylece modelini etkilemeden, referans için veri kümesinde tutabiliyorsun.
Bu egzersiz
R'da Feature Engineering
kursunun bir parçasıdırEgzersiz talimatları
...1’in rolünü "ID" olarak güncelle.- Verilerin eksik olduğu tüm yordayıcılara değer ata.
- Tüm ad nominal yordayıcılar için kukla değişkenler oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition ~., data = train) %>%
# Update the role of "...1" to "ID"
___(...1, new_role = "ID" ) %>%
# Impute values to all predictors where data are missing
step_impute_knn(___) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
lr_recipe