Préparer le terrain
Vous allez explorer le jeu de données attrition_num sous l’angle de la PCA afin de vérifier s’il est possible de réduire la dimension tout en préservant l’essentiel de l’information. Commencez par créer une recette qui filtre les variables à variance quasi nulle, normalise les données et applique une PCA.
Le jeu de données attrition_num est déjà chargé pour vous.
Cet exercice fait partie du cours
Feature engineering en R
Instructions
- Supprimez les variables susceptibles d’avoir une variance quasi nulle.
- Normalisez toutes les données numériques.
- Appliquez une PCA.
- Préparez la recette pour accéder aux noms des éléments de sortie.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
pc_recipe <- recipe(~., data = attrition_num) %>%
# Remove possible near-zero variance features
___(all_numeric()) %>%
# Normalize all numeric data
___(___()) %>%
# Apply PCA
___(all_numeric())
# Access the names of the output elements by preparing the recipe
pca_output <- ___(___)
names(pca_output)