Aan de slagGa gratis aan de slag

Normaliseren en log-transformeren

Je krijgt een gegevensset, attrition_num, met numerieke gegevens over werknemers die het bedrijf hebben verlaten. Kenmerken zijn onder andere Age, DistanceFromHome en MonthlyRate.

Je wilt deze gegevens gebruiken om een model te bouwen dat kan voorspellen of een werknemer waarschijnlijk blijft, aangeduid met Attrition, een binaire variabele gecodeerd als een factor. Ter voorbereiding op het modelleren wil je mogelijke scheefheid verminderen en voorkomen dat sommige variabelen zwaarder gaan wegen door verschillen in schaal.

De gegevens attrition_num en de train- en test-splits zijn al voor je geladen.

Deze oefening maakt deel uit van de cursus

Feature engineering in R

Cursus bekijken

Oefeninstructies

  • Normaliseer alle numerieke predictoren.
  • Pas een log-transformatie toe op alle numerieke features, met een offset van één.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

lr_model <- logistic_reg()

lr_recipe <- 
  recipe(Attrition~., data = train) %>%

# Normalize all numeric predictors
  ___(all_numeric_predictors()) %>%

# Log-transform all numeric features, with an offset of one
  ___(___, offset = ___)

lr_workflow <- 
  workflow() %>%
  add_model(lr_model) %>%
  add_recipe(lr_recipe)

lr_workflow
Code bewerken en uitvoeren