CommencerCommencer gratuitement

Normaliser et appliquer une transformation logarithmique

On vous fournit un jeu de données, attrition_num, contenant des données numériques sur les employés ayant quitté l’entreprise. Parmi les variables figurent Age, DistanceFromHome et MonthlyRate.

Vous souhaitez utiliser ces données pour construire un modèle capable de prédire si un employé est susceptible de rester, indiqué par Attrition, une variable binaire de type factor. En préparation du modèle, vous voulez réduire une éventuelle asymétrie (skewness) et éviter que certaines variables ne dominent les autres en raison de différences d’échelle.

Les données attrition_num ainsi que les partitions train et test sont déjà chargées.

Cet exercice fait partie du cours

Feature engineering en R

Afficher le cours

Instructions

  • Normalisez tous les prédicteurs numériques.
  • Appliquez une transformation logarithmique à toutes les variables numériques, avec un décalage (offset) de un.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

lr_model <- logistic_reg()

lr_recipe <- 
  recipe(Attrition~., data = train) %>%

# Normalize all numeric predictors
  ___(all_numeric_predictors()) %>%

# Log-transform all numeric features, with an offset of one
  ___(___, offset = ___)

lr_workflow <- 
  workflow() %>%
  add_model(lr_model) %>%
  add_recipe(lr_recipe)

lr_workflow
Modifier et exécuter le code