CommencerCommencer gratuitement

Créer un workflow recette-modèle

Le package tidymodels permet de combiner des recettes et des modèles dans des workflows. Les workflows facilitent la création d’un enchaînement d’étapes pour préparer les données et entraîner des modèles. Ils peuvent ensuite être appliqués facilement à de nouvelles données, sans avoir à redéfinir tout le prétraitement et la construction du modèle. Pratique : les workflows disposent d’une fonction fit() qui ajuste à la fois la recette et le modèle aux données.

Dans cet exercice, vous allez vous entraîner à créer une recette et un modèle, puis à les ajouter à un workflow, afin qu’ils soient prêts à être ajustés aux données. Les jeux train et test des données de départs dans l’assurance santé des employé·e·s sont à votre disposition. La variable cible est Attrition.

Les packages tidyverse et tidymodels ont été chargés pour vous.

Cet exercice fait partie du cours

Réduction de dimension en R

Afficher le cours

Instructions

  • Définissez une recette à partir des données train avec step_filter_missing(), step_scale() et step_nzv() pour, respectivement, supprimer les NA, mettre à l’échelle les variables numériques et retirer les variables à faible variance. Utilisez un seuil de 0,5 pour step_filter_missing().
  • Définissez un modèle de régression logistique avec le moteur "glm".
  • Ajoutez feature_selection_recipe et lr_model à un workflow nommé attrition_wflow.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create recipe
feature_selection_recipe <- 
  ___(___ ~ ., data = ___) %>% 
  ___(___(), threshold = 0.5) %>% 
  ___(___()) %>% 
  ___(___()) %>% 
  prep()
  
# Create model
lr_model <- ___() %>% 
  ___("___")

# Add recipe and model to a workflow
attrition_wflow <- ___() %>% 
  ___(___) %>% 
  ___(___)
Modifier et exécuter le code