CommencerCommencer gratuitement

Prétraiter

C’est le moment de faire du feature engineering ! Vous devez construire une recette pour traiter des variables non informatives mais potentiellement utiles, comme un identifiant d’observation, ou encore gérer les valeurs manquantes. C’est aussi l’occasion de transformer certains prédicteurs : par exemple, normaliser les variables numériques et créer des variables fictives pour les variables catégorielles.

Le jeu de données attrition ainsi que les partitions train et test que vous avez créées dans l’exercice précédent sont disponibles dans votre environnement.

Cet exercice fait partie du cours

Feature engineering en R

Afficher le cours

Instructions

  • Normalisez toutes les variables numériques.
  • Imputez les valeurs manquantes avec l’algorithme d’imputation knn.
  • Créez des variables fictives pour tous les prédicteurs nominaux.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

recipe <- recipe(Attrition ~ ., data = train) %>%
  update_role(...1, new_role = "ID") %>%

# Normalize all numeric features
  ___(all_numeric_predictors()) %>% 

# Impute missing values using the knn imputation algorithm
  ___(all_predictors()) %>%

# Create dummy variables for all nominal predictors
  ___(all_nominal_predictors())
 
recipe
Modifier et exécuter le code