Qui reste ?
Il est temps de vous entraîner à combiner plusieurs transformations sur les données attrition_num. Commencez par normaliser ou quasi-normaliser les variables numériques en appliquant une transformation de Yeo-Johnson. Ensuite, transformez les prédicteurs numériques en percentiles, créez des variables indicatrices (dummy) et éliminez les variables avec une variance quasi nulle.
Cet exercice fait partie du cours
Feature engineering en R
Instructions
- Appliquez une transformation de Yeo-Johnson à toutes les variables numériques.
- Transformez tous les prédicteurs numériques en percentiles.
- Créez des variables indicatrices (dummy) pour tous les prédicteurs nominaux.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
lr_recipe <- recipe(Attrition ~., data = train) %>%
# Apply a Yeo-Johnson transformation to all numeric variables
___ %>%
# Transform all numeric predictors into percentiles
___ %>%
# Create dummy variables for all nominal predictors
___
lr_workflow <- workflow() %>% add_model(lr_model) %>% add_recipe(lr_recipe)
lr_fit <- lr_workflow %>% fit(train)
lr_aug <- lr_fit %>% augment(test)
lr_aug %>% class_evaluate(truth = Attrition, estimate = .pred_class,.pred_No)