Normalleştirme ve log dönüşümü
Sana, şirketten ayrılan çalışanlara ait sayısal veriler içeren attrition_num adlı bir veri kümesi verildi. Özellikler arasında
Age, DistanceFromHome ve MonthlyRate bulunuyor.
Bu veriyi, bir çalışanın şirkette kalıp kalmayacağını tahmin edebilen bir model kurmak için kullanmak istiyorsun. Bu durum Attrition ile gösteriliyor ve factor olarak kodlanmış ikili bir değişken. Modellemeden önce, olası çarpıklığı (skewness) azaltmak ve ölçek farkları nedeniyle bazı değişkenlerin diğerlerini baskılamasını engellemek istiyorsun.
attrition_num verisi ile train ve test ayrımları senin için yüklendi.
Bu egzersiz, kursun bir parçasıdır
R'da Feature Engineering
Egzersiz talimatları
- Tüm sayısal yordayıcıları (predictor) normalleştir.
- Tüm sayısal özelliklere, bir birim offset ile log dönüşümü uygula.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition~., data = train) %>%
# Normalize all numeric predictors
___(all_numeric_predictors()) %>%
# Log-transform all numeric features, with an offset of one
___(___, offset = ___)
lr_workflow <-
workflow() %>%
add_model(lr_model) %>%
add_recipe(lr_recipe)
lr_workflow