Box-Cox-transformatie
Met de gegevensset attrition_num met alle numerieke gegevens over medewerkers die het bedrijf hebben verlaten, wil je een model bouwen dat kan voorspellen of een medewerker waarschijnlijk blijft, met Attrition, een binaire variabele gecodeerd als een factor. Om de features bijna normaal verdeeld te krijgen, maak je een recipe die de Box-Cox-transformatie toepast.
De attrition_num-data, de logistische regressie lr_model, de door de gebruiker gedefinieerde functie class-evaluate() en de train- en test-splits zijn voor je geladen.
Deze oefening maakt deel uit van de cursus
Feature engineering in R
Oefeninstructies
- Maak een recipe die Box-Cox gebruikt om alle numerieke features te transformeren, inclusief de target.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a recipe that uses Box-Cox to transform all numeric features
lr_recipe_BC <-
recipe(Attrition ~., data = train) %>%
___(___)
lr_workflow_BC <- workflow() %>%
add_model(lr_model) %>%
add_recipe(lr_recipe_BC)
lr_fit_BC <- lr_workflow_BC %>%
fit(train)
lr_aug_BC <-
lr_fit_BC %>% augment(test)
lr_aug_BC %>% class_evaluate(truth = Attrition,
estimate = .pred_class,.pred_No)