Résumer une ACP dans R
Comme nous l’avons vu dans la vidéo, il y avait une variable catégorielle (position) dans nos données qui semblait former des groupes dans les deux premières composantes principales. Même après mise à l’échelle des données, ces deux CP expliquent encore une grande partie de la variabilité. Et si nous ne regardions qu’une seule position à la fois ?
Cet exercice fait partie du cours
Algèbre linéaire pour la data science en R
Instructions
Réalisez la même analyse que dans l’exercice précédent, mais uniquement sur le sous-ensemble où la position est égale à "WR" (wide receiver) :
- Utilisez la fonction
scale()pour mettre à l’échelle les colonnes 5 à 12 des donnéescombine_WR. Nommez ce data frameBet affichez quelques valeurs avechead(). - Utilisez
prcomp()pour réaliser l’analyse en composantes principales, puis résumez l’analyse avecsummary().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Subset combine only to "WR"
combine_WR <- subset(combine, position == "WR")
# Scale columns 5-12 of combine_WR
B <- ___(___[, ___])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
___(___)