CommencerCommencer gratuitement

Résumer une ACP dans R

Comme nous l’avons vu dans la vidéo, il y avait une variable catégorielle (position) dans nos données qui semblait former des groupes dans les deux premières composantes principales. Même après mise à l’échelle des données, ces deux CP expliquent encore une grande partie de la variabilité. Et si nous ne regardions qu’une seule position à la fois ?

Cet exercice fait partie du cours

Algèbre linéaire pour la data science en R

Afficher le cours

Instructions

Réalisez la même analyse que dans l’exercice précédent, mais uniquement sur le sous-ensemble où la position est égale à "WR" (wide receiver) :

  • Utilisez la fonction scale() pour mettre à l’échelle les colonnes 5 à 12 des données combine_WR. Nommez ce data frame B et affichez quelques valeurs avec head().
  • Utilisez prcomp() pour réaliser l’analyse en composantes principales, puis résumez l’analyse avec summary().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Subset combine only to "WR"
combine_WR <- subset(combine, position == "WR")

# Scale columns 5-12 of combine_WR
B <- ___(___[, ___])

# Print the first 6 rows of the data
___

# Summarize the principal component analysis
___(___)
Modifier et exécuter le code