Visualiser la variance expliquée
Vous allez maintenant créer un scree plot montrant la proportion de variance expliquée par chaque composante principale, ainsi que la proportion cumulée de variance expliquée.
Rappelez-vous, d’après la vidéo, que ces graphiques aident à déterminer le nombre de composantes principales à conserver. Une façon de choisir ce nombre consiste à repérer un « coude » dans le scree plot, indiquant que lorsque le nombre de composantes principales augmente, le rythme auquel la variance est expliquée diminue fortement. En l’absence de coude net, vous pouvez utiliser le scree plot comme guide pour fixer un seuil.
Cet exercice fait partie du cours
Apprentissage non supervisé en R
Instructions
La proportion de variance expliquée est toujours disponible dans l’objet pve que vous avez créé au dernier exercice.
- Utilisez
plot()pour tracer la proportion de variance expliquée par chaque composante principale. - Utilisez
plot()etcumsum()(somme cumulative) pour tracer la proportion cumulée de variance expliquée en fonction du nombre de composantes principales.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Plot variance explained for each principal component
plot(___, xlab = "Principal Component",
ylab = "Proportion of Variance Explained",
ylim = c(0, 1), type = "b")
# Plot cumulative proportion of variance explained
plot(___, xlab = "Principal Component",
ylab = "Cumulative Proportion of Variance Explained",
ylim = c(0, 1), type = "b")