Variance expliquée
Le deuxième type de graphique courant pour comprendre les modèles d’ACP est le scree plot (ou graphique des éboulis). Il montre la variance expliquée à mesure que le nombre de composantes principales augmente. Parfois, on trace aussi la variance expliquée cumulée.
Dans cet exercice et le suivant, vous allez préparer les données du modèle pr.out créé au début du chapitre pour les utiliser dans un scree plot. Cette préparation est nécessaire car il n’existe pas de fonction intégrée dans R pour créer directement ce type de graphique.
Cet exercice fait partie du cours
Apprentissage non supervisé en R
Instructions
pr.out et les données pokemon sont toujours disponibles dans votre espace de travail.
- Affectez à la variable
pr.varle carré des écarts-types des composantes principales (c’est-à-dire la variance). L’écart-type des composantes principales est disponible dans le composantsdevde l’objet de modèle d’ACP. - Affectez à la variable
pvela proportion de variance expliquée, calculée en divisantpr.varpar la variance totale expliquée par l’ensemble des composantes principales.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Variability of each principal component: pr.var
pr.var <- ___
# Variance explained by each principal component: pve
pve <- ___ / ___