PCA in R zusammenfassen
Wie wir im Video gesehen haben, gab es in unseren Daten eine kategoriale Variable (position), die sich in den Clustern der ersten beiden Hauptkomponenten widerspiegelte. Selbst nach dem Skalieren der Daten erklären diese beiden PCs noch einen großen Teil der Variation in den Daten. Was passiert, wenn wir jeweils nur eine Position betrachten?
Diese Übung ist Teil des Kurses
Lineare Algebra für Data Science in R
Anleitung zur Übung
Führe die gleiche Analyse wie in der vorherigen Übung durch, aber verwende nur den Teil der Daten, bei dem position gleich „WR“ (wide receiver) ist:
- Verwende die Funktion
scale(), um die 5. bis 12. Spalte der Datencombine_WRzu skalieren. Nenne diesen Data FrameBund zeige ein paar Werte mithead()an. - Verwende
prcomp(), um eine Hauptkomponentenanalyse auf den Daten durchzuführen, und fasse diese Analyse mitsummary()zusammen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Subset combine only to "WR"
combine_WR <- subset(combine, position == "WR")
# Scale columns 5-12 of combine_WR
B <- ___(___[, ___])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
___(___)