Visualiser la variance expliquée
Avec tous ces calculs en tête, il est toujours utile de représenter les données visuellement. Vous allez maintenant créer un graphique en colonnes montrant la variance expliquée par composante principale.
Le vecteur variable_explained que vous avez créé dans l’exercice précédent est disponible, et le theme_() de ggplot() est défini sur classic.
Cet exercice fait partie du cours
Feature engineering en R
Instructions
- Utilisez les informations du tibble PCA pour créer un graphique en colonnes de la variance expliquée.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
PCA = tibble(PC = 1:length(sdev), var_explained = var_explained,
cumulative = cumsum(var_explained))
# Use the information in the PCA tibble to create a column plot of variance explained
PCA %>% ggplot(aes(x = ___, y = ___)) +
geom_col(fill = "steelblue") +
xlab("Principal components") +
ylab("Variance explained")