Régularisation manuelle avec Lasso
Le jeu de données attrition comporte 30 variables. Votre service des ressources humaines vous demande de construire un modèle facile à interpréter et à maintenir. Il souhaite en particulier réduire le nombre de variables afin que votre modèle soit aussi interprétable que possible.
Dans cet exercice, vous allez utiliser Lasso pour réduire automatiquement le nombre de variables de votre modèle. Pour cette première tentative, vous indiquerez manuellement une pénalité et observerez le comportement du modèle.
Les données train et test, ainsi qu'une recipe de base, sont déjà chargées pour vous.
Cet exercice fait partie du cours
Feature engineering en R
Instructions
- Configurez votre modèle de régression logistique pour utiliser le moteur
glmnet. - Définissez les arguments pour exécuter Lasso avec une pénalité de 0,06.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
model_lasso_manual <- logistic_reg() %>%
# Set the glmnet engine for your logistic regression model
___(___) %>%
# Set arguments to run Lasso with a penalty of 0.06
set_args(mixture = ___, ___ = ___)
workflow_lasso_manual <- workflow() %>%
add_model(model_lasso_manual) %>%
add_recipe(recipe)
fit_lasso_manual <- workflow_lasso_manual %>%
fit(train)
tidy(fit_lasso_manual)