Mettre les données à l’échelle avant une ACP
Lorsque les variables n’ont pas la même échelle, il est souvent essentiel de mettre d’abord les données à l’échelle. En effet, des variables avec des valeurs plus grandes peuvent influencer l’analyse même si leur variabilité est relativement faible.
Le data frame combine est déjà chargé pour vous.
Cet exercice fait partie du cours
Algèbre linéaire pour la data science en R
Instructions
- Utilisez la fonction
scale()pour mettre à l’échelle les colonnes 5 à 12 des donnéescombine. Nommez ce data frameBet affichez quelques valeurs avechead(). - Utilisez
prcomp()pour réaliser une analyse en composantes principales sur ces données, puis résumez l’analyse avecsummary().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Scale columns 5-12 of combine
B <- ___(___[, 5:12])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
summary(____(B))