PCA in R zusammenfassen
Wie wir im Video gesehen haben, gab es in unseren Daten eine kategoriale Variable (position), die sich in den Clustern der ersten beiden Hauptkomponenten widerspiegelte. Selbst nach dem Skalieren der Daten erklären diese beiden PCs noch einen großen Teil der Variation in den Daten. Was passiert, wenn wir jeweils nur eine Position betrachten?
Diese Übung ist Teil des Kurses
<Kurs>Lineare Algebra für Data Science in R</Kurs>Übungsanweisungen
Führe die gleiche Analyse wie in der vorherigen Übung durch, aber verwende nur den Teil der Daten, bei dem position gleich „WR“ (wide receiver) ist:
- Verwende die Funktion
scale(), um die 5. bis 12. Spalte der Datencombine_WRzu skalieren. Nenne diesen Data FrameBund zeige ein paar Werte mithead()an. - Verwende
prcomp(), um eine Hauptkomponentenanalyse auf den Daten durchzuführen, und fasse diese Analyse mitsummary()zusammen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Subset combine only to "WR"
combine_WR <- subset(combine, position == "WR")
# Scale columns 5-12 of combine_WR
B <- ___(___[, ___])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
___(___)