Prétraiter
C’est le moment de faire du feature engineering ! Vous devez construire une recette pour traiter des variables non informatives mais potentiellement utiles, comme un identifiant d’observation, ou encore gérer les valeurs manquantes. C’est aussi l’occasion de transformer certains prédicteurs : par exemple, normaliser les variables numériques et créer des variables fictives pour les variables catégorielles.
Le jeu de données attrition ainsi que les partitions train et test que vous avez créées dans l’exercice précédent sont disponibles dans votre environnement.
Cet exercice fait partie du cours
Feature engineering en R
Instructions
- Normalisez toutes les variables numériques.
- Imputez les valeurs manquantes avec l’algorithme d’imputation
knn. - Créez des variables fictives pour tous les prédicteurs nominaux.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
recipe <- recipe(Attrition ~ ., data = train) %>%
update_role(...1, new_role = "ID") %>%
# Normalize all numeric features
___(all_numeric_predictors()) %>%
# Impute missing values using the knn imputation algorithm
___(all_predictors()) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
recipe