Aan de slagGa gratis aan de slag

Yeo-Johnson-transformatie

Met de attrition_num-gegevensset met alle numerieke gegevens over medewerkers die het bedrijf hebben verlaten, wil je een model bouwen dat kan voorspellen of een medewerker waarschijnlijk blijft, met Attrition, een binaire variabele gecodeerd als een factor. Om de features zo goed als normaal verdeeld te krijgen, maak je een recipe die de Yeo-Johnson-transformatie toepast.

De attrition_num-data, de logistische regressie lr_model, de door de gebruiker gedefinieerde functie class-evaluate(), en de train- en test-splits zijn al voor je geladen.

Deze oefening maakt deel uit van de cursus

Feature engineering in R

Cursus bekijken

Oefeninstructies

  • Maak een recipe die Yeo-Johnson gebruikt om alle numerieke features te transformeren, inclusief de target.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a recipe that uses Yeo-Johnson to transform all numeric features
lr_recipe_YJ <- 
  recipe(Attrition ~., data = train) %>%
  ___

lr_workflow_YJ <- workflow() %>%
  add_model(lr_model) %>%
  add_recipe(lr_recipe_YJ)
lr_fit_YJ <- lr_workflow_YJ %>%
  fit(train)
lr_aug_YJ <-
  lr_fit_YJ %>% augment(test)
lr_aug_YJ %>% class_evaluate(truth = Attrition,
                 estimate = .pred_class,.pred_No)
Code bewerken en uitvoeren