Normalisieren und Log-Transformation
Du bekommst einen Datensatz attrition_num mit numerischen Daten zu Mitarbeitenden, die das Unternehmen verlassen haben. Zu den Merkmalen gehören
Age, DistanceFromHome und MonthlyRate.
Du möchtest diese Daten nutzen, um ein Modell zu bauen, das vorhersagen kann, ob eine Person voraussichtlich bleibt, gekennzeichnet durch Attrition, eine binäre Variable als factor kodiert. Zur Vorbereitung auf das Modellieren willst du mögliche Schiefe reduzieren und verhindern, dass einige Variablen aufgrund unterschiedlicher Skalen andere überlagern.
Die Daten attrition_num sowie die Splits train und test sind bereits geladen.
Diese Übung ist Teil des Kurses
<Kurs>Feature Engineering in R</Kurs>Übungsanweisungen
- Normalisiere alle numerischen Prädiktoren.
- Führe für alle numerischen Merkmale eine Log-Transformation mit einem Offset von 1 durch.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition~., data = train) %>%
# Normalize all numeric predictors
___(all_numeric_predictors()) %>%
# Log-transform all numeric features, with an offset of one
___(___, offset = ___)
lr_workflow <-
workflow() %>%
add_model(lr_model) %>%
add_recipe(lr_recipe)
lr_workflow