Normaliseren en log-transformeren
Je krijgt een gegevensset, attrition_num, met numerieke gegevens over werknemers die het bedrijf hebben verlaten. Kenmerken zijn onder andere
Age, DistanceFromHome en MonthlyRate.
Je wilt deze gegevens gebruiken om een model te bouwen dat kan voorspellen of een werknemer waarschijnlijk blijft, aangeduid met Attrition, een binaire variabele gecodeerd als een factor. Ter voorbereiding op het modelleren wil je mogelijke scheefheid verminderen en voorkomen dat sommige variabelen zwaarder gaan wegen door verschillen in schaal.
De gegevens attrition_num en de train- en test-splits zijn al voor je geladen.
Deze oefening maakt deel uit van de cursus
Feature engineering in R
Oefeninstructies
- Normaliseer alle numerieke predictoren.
- Pas een log-transformatie toe op alle numerieke features, met een offset van één.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition~., data = train) %>%
# Normalize all numeric predictors
___(all_numeric_predictors()) %>%
# Log-transform all numeric features, with an offset of one
___(___, offset = ___)
lr_workflow <-
workflow() %>%
add_model(lr_model) %>%
add_recipe(lr_recipe)
lr_workflow