Een gereduceerd model bouwen
Analyse van variabelebelang hielp je de meest voorspellende features in de gegevensset attrition te vinden. Op basis daarvan bouw je een sterk gereduceerd model met slechts drie variabelen: OverTime, DistanceFromHome en NumCompaniesWorked, en vergelijk je de prestaties met de baseline van het volledige model. De statistieken die je voor het volledige model hebt geschat, staan in aug_full.
Alle data, inclusief de splits train en test, is beschikbaar in je omgeving.
Deze oefening maakt deel uit van de cursus
Feature engineering in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a recipe using the formula syntax that includes only OverTime, DistanceFromHome and NumCompaniesWorked as predictors
recipe_reduced <-
___(Attrition ~ ___ + ___ + ___, data = train)
# Bundle the recipe with your model
workflow_reduced <-
workflow() %>%
add_model(model) %>%
___