Normalleştirme ve log dönüşümü
Sana, şirketten ayrılan çalışanlara ait sayısal veriler içeren attrition_num adlı bir veri kümesi verildi. Özellikler arasında
Age, DistanceFromHome ve MonthlyRate bulunuyor.
Bu veriyi, bir çalışanın şirkette kalıp kalmayacağını tahmin edebilen bir model kurmak için kullanmak istiyorsun. Bu durum Attrition ile gösteriliyor ve factor olarak kodlanmış ikili bir değişken. Modellemeden önce, olası çarpıklığı (skewness) azaltmak ve ölçek farkları nedeniyle bazı değişkenlerin diğerlerini baskılamasını engellemek istiyorsun.
attrition_num verisi ile train ve test ayrımları senin için yüklendi.
Bu egzersiz
R'da Feature Engineering
kursunun bir parçasıdırEgzersiz talimatları
- Tüm sayısal yordayıcıları (predictor) normalleştir.
- Tüm sayısal özelliklere, bir birim offset ile log dönüşümü uygula.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition~., data = train) %>%
# Normalize all numeric predictors
___(all_numeric_predictors()) %>%
# Log-transform all numeric features, with an offset of one
___(___, offset = ___)
lr_workflow <-
workflow() %>%
add_model(lr_model) %>%
add_recipe(lr_recipe)
lr_workflow