CommencerCommencer gratuitement

Transformation de Yeo-Johnson

En utilisant le jeu de données attrition_num contenant toutes les données numériques sur les employés qui ont quitté l’entreprise, vous souhaitez construire un modèle capable de prédire si un employé est susceptible de rester, en vous appuyant sur Attrition, une variable binaire encodée comme un factor. Pour rendre les variables proches d’une distribution normale, vous allez créer une recette qui applique la transformation Yeo-Johnson.

Les données attrition_num, la régression logistique lr_model, la fonction personnalisée class-evaluate() et les partitions train et test sont déjà chargées pour vous.

Cet exercice fait partie du cours

Feature engineering en R

Afficher le cours

Instructions

  • Créez une recette qui utilise Yeo-Johnson pour transformer toutes les variables numériques, y compris la cible.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a recipe that uses Yeo-Johnson to transform all numeric features
lr_recipe_YJ <- 
  recipe(Attrition ~., data = train) %>%
  ___

lr_workflow_YJ <- workflow() %>%
  add_model(lr_model) %>%
  add_recipe(lr_recipe_YJ)
lr_fit_YJ <- lr_workflow_YJ %>%
  fit(train)
lr_aug_YJ <-
  lr_fit_YJ %>% augment(test)
lr_aug_YJ %>% class_evaluate(truth = Attrition,
                 estimate = .pred_class,.pred_No)
Modifier et exécuter le code