LoslegenKostenlos starten

Normalisieren und Log-Transformation

Du bekommst einen Datensatz attrition_num mit numerischen Daten zu Mitarbeitenden, die das Unternehmen verlassen haben. Zu den Merkmalen gehören Age, DistanceFromHome und MonthlyRate.

Du möchtest diese Daten nutzen, um ein Modell zu bauen, das vorhersagen kann, ob eine Person voraussichtlich bleibt, gekennzeichnet durch Attrition, eine binäre Variable als factor kodiert. Zur Vorbereitung auf das Modellieren willst du mögliche Schiefe reduzieren und verhindern, dass einige Variablen aufgrund unterschiedlicher Skalen andere überlagern.

Die Daten attrition_num sowie die Splits train und test sind bereits geladen.

Diese Übung ist Teil des Kurses

<Kurs>Feature Engineering in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Normalisiere alle numerischen Prädiktoren.
  • Führe für alle numerischen Merkmale eine Log-Transformation mit einem Offset von 1 durch.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

lr_model <- logistic_reg()

lr_recipe <- 
  recipe(Attrition~., data = train) %>%

# Normalize all numeric predictors
  ___(all_numeric_predictors()) %>%

# Log-transform all numeric features, with an offset of one
  ___(___, offset = ___)

lr_workflow <- 
  workflow() %>%
  add_model(lr_model) %>%
  add_recipe(lr_recipe)

lr_workflow
Code bearbeiten und ausführen