Aan de slagBegin gratis

Normaliseren en log-transformeren

Je krijgt een gegevensset, attrition_num, met numerieke gegevens over werknemers die het bedrijf hebben verlaten. Kenmerken zijn onder andere Age, DistanceFromHome en MonthlyRate.

Je wilt deze gegevens gebruiken om een model te bouwen dat kan voorspellen of een werknemer waarschijnlijk blijft, aangeduid met Attrition, een binaire variabele gecodeerd als een factor. Ter voorbereiding op het modelleren wil je mogelijke scheefheid verminderen en voorkomen dat sommige variabelen zwaarder gaan wegen door verschillen in schaal.

De gegevens attrition_num en de train- en test-splits zijn al voor je geladen.

Deze oefening maakt deel uit van de cursus

Feature engineering in R

Bekijk cursus

Oefeninstructies

  • Normaliseer alle numerieke predictoren.
  • Pas een log-transformatie toe op alle numerieke features, met een offset van één.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

lr_model <- logistic_reg()

lr_recipe <- 
  recipe(Attrition~., data = train) %>%

# Normalize all numeric predictors
  ___(all_numeric_predictors()) %>%

# Log-transform all numeric features, with an offset of one
  ___(___, offset = ___)

lr_workflow <- 
  workflow() %>%
  add_model(lr_model) %>%
  add_recipe(lr_recipe)

lr_workflow
Code bewerken en uitvoeren