Handmatige regularisatie met Lasso
De attrition-gegevensset heeft 30 variabelen. Je HR-afdeling vraagt je een model te bouwen dat makkelijk te interpreteren en te onderhouden is. Ze willen specifiek het aantal features verminderen zodat je model zo interpreteerbaar mogelijk is.
In deze oefening gebruik je Lasso om het aantal variabelen in je model automatisch te verminderen. In deze eerste poging vul je handmatig een penalty in en observeer je het gedrag van het model.
train- en test-data en een basis-recipe zijn al voor je geladen.
Deze oefening maakt deel uit van de cursus
Feature engineering in R
Oefeninstructies
- Stel je logistische regressiemodel in om de
glmnet-engine te gebruiken. - Stel de argumenten in om Lasso uit te voeren met een penalty van 0,06.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
model_lasso_manual <- logistic_reg() %>%
# Set the glmnet engine for your logistic regression model
___(___) %>%
# Set arguments to run Lasso with a penalty of 0.06
set_args(mixture = ___, ___ = ___)
workflow_lasso_manual <- workflow() %>%
add_model(model_lasso_manual) %>%
add_recipe(recipe)
fit_lasso_manual <- workflow_lasso_manual %>%
fit(train)
tidy(fit_lasso_manual)