Eksik değerleri atama ve kukla değişkenler oluşturma
attrition veri kümesinde eksik değerleri tespit edip bunların tamamen rastgele eksik (MCAR) olduğuna karar verdikten sonra, K En Yakın Komşu (KNN) atamasını kullanmaya karar veriyorsun. Özellik mühendisliği recipe’ını yapılandırırken, tüm ad nominal değişkenlerin için kukla değişkenler oluşturmayı ve ...1 değişkeninin rolünü "ID" olarak güncellemeyi seçiyorsun; böylece modelini etkilemeden, referans için veri kümesinde tutabiliyorsun.
Bu egzersiz, kursun bir parçasıdır
R'da Feature Engineering
Egzersiz talimatları
...1’in rolünü "ID" olarak güncelle.- Verilerin eksik olduğu tüm yordayıcılara değer ata.
- Tüm ad nominal yordayıcılar için kukla değişkenler oluştur.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition ~., data = train) %>%
# Update the role of "...1" to "ID"
___(...1, new_role = "ID" ) %>%
# Impute values to all predictors where data are missing
step_impute_knn(___) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
lr_recipe