Normalisieren und Log-Transformation
Du bekommst einen Datensatz attrition_num mit numerischen Daten zu Mitarbeitenden, die das Unternehmen verlassen haben. Zu den Merkmalen gehören
Age, DistanceFromHome und MonthlyRate.
Du möchtest diese Daten nutzen, um ein Modell zu bauen, das vorhersagen kann, ob eine Person voraussichtlich bleibt, gekennzeichnet durch Attrition, eine binäre Variable als factor kodiert. Zur Vorbereitung auf das Modellieren willst du mögliche Schiefe reduzieren und verhindern, dass einige Variablen aufgrund unterschiedlicher Skalen andere überlagern.
Die Daten attrition_num sowie die Splits train und test sind bereits geladen.
Diese Übung ist Teil des Kurses
Feature Engineering in R
Anleitung zur Übung
- Normalisiere alle numerischen Prädiktoren.
- Führe für alle numerischen Merkmale eine Log-Transformation mit einem Offset von 1 durch.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition~., data = train) %>%
# Normalize all numeric predictors
___(all_numeric_predictors()) %>%
# Log-transform all numeric features, with an offset of one
___(___, offset = ___)
lr_workflow <-
workflow() %>%
add_model(lr_model) %>%
add_recipe(lr_recipe)
lr_workflow