Construire un modèle réduit
L’analyse de l’importance des variables vous a permis d’identifier les caractéristiques les plus prédictives du jeu de données attrition. À partir de cela, vous allez construire un modèle fortement réduit avec seulement trois variables : OverTime, DistanceFromHome et NumCompaniesWorked, puis comparer ses performances à la référence du modèle complet. Les métriques que vous avez estimées pour le modèle complet sont stockées dans aug_full.
Toutes les données, ainsi que les partitions train et test, sont disponibles dans votre environnement.
Cet exercice fait partie du cours
Feature engineering en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a recipe using the formula syntax that includes only OverTime, DistanceFromHome and NumCompaniesWorked as predictors
recipe_reduced <-
___(Attrition ~ ___ + ___ + ___, data = train)
# Bundle the recipe with your model
workflow_reduced <-
workflow() %>%
add_model(model) %>%
___