Normaliser et appliquer une transformation logarithmique
On vous fournit un jeu de données, attrition_num, contenant des données numériques sur les employés ayant quitté l’entreprise. Parmi les variables figurent
Age, DistanceFromHome et MonthlyRate.
Vous souhaitez utiliser ces données pour construire un modèle capable de prédire si un employé est susceptible de rester, indiqué par Attrition, une variable binaire de type factor. En préparation du modèle, vous voulez réduire une éventuelle asymétrie (skewness) et éviter que certaines variables ne dominent les autres en raison de différences d’échelle.
Les données attrition_num ainsi que les partitions train et test sont déjà chargées.
Cet exercice fait partie du cours
Feature engineering en R
Instructions
- Normalisez tous les prédicteurs numériques.
- Appliquez une transformation logarithmique à toutes les variables numériques, avec un décalage (offset) de un.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition~., data = train) %>%
# Normalize all numeric predictors
___(all_numeric_predictors()) %>%
# Log-transform all numeric features, with an offset of one
___(___, offset = ___)
lr_workflow <-
workflow() %>%
add_model(lr_model) %>%
add_recipe(lr_recipe)
lr_workflow