Créer un workflow recette-modèle
Le package tidymodels permet de combiner des recettes et des modèles dans des workflows. Les workflows facilitent la création d’un enchaînement d’étapes pour préparer les données et entraîner des modèles. Ils peuvent ensuite être appliqués facilement à de nouvelles données, sans avoir à redéfinir tout le prétraitement et la construction du modèle. Pratique : les workflows disposent d’une fonction fit() qui ajuste à la fois la recette et le modèle aux données.
Dans cet exercice, vous allez vous entraîner à créer une recette et un modèle, puis à les ajouter à un workflow, afin qu’ils soient prêts à être ajustés aux données. Les jeux train et test des données de départs dans l’assurance santé des employé·e·s sont à votre disposition. La variable cible est Attrition.
Les packages tidyverse et tidymodels ont été chargés pour vous.
Cet exercice fait partie du cours
Réduction de dimension en R
Instructions
- Définissez une recette à partir des données
trainavecstep_filter_missing(),step_scale()etstep_nzv()pour, respectivement, supprimer les NA, mettre à l’échelle les variables numériques et retirer les variables à faible variance. Utilisez un seuil de 0,5 pourstep_filter_missing(). - Définissez un modèle de régression logistique avec le moteur "glm".
- Ajoutez
feature_selection_recipeetlr_modelà un workflow nomméattrition_wflow.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create recipe
feature_selection_recipe <-
___(___ ~ ., data = ___) %>%
___(___(), threshold = 0.5) %>%
___(___()) %>%
___(___()) %>%
prep()
# Create model
lr_model <- ___() %>%
___("___")
# Add recipe and model to a workflow
attrition_wflow <- ___() %>%
___(___) %>%
___(___)