PCA in R zusammenfassen

Wie wir im Video gesehen haben, gab es in unseren Daten eine kategoriale Variable (position), die sich in den Clustern der ersten beiden Hauptkomponenten widerspiegelte. Selbst nach dem Skalieren der Daten erklären diese beiden PCs noch einen großen Teil der Variation in den Daten. Was passiert, wenn wir jeweils nur eine Position betrachten?

Diese Übung ist Teil des Kurses

<Kurs>Lineare Algebra für Data Science in R</Kurs>

Kurs ansehen

Übungsanweisungen

Führe die gleiche Analyse wie in der vorherigen Übung durch, aber verwende nur den Teil der Daten, bei dem position gleich „WR“ (wide receiver) ist:

Verwende die Funktion scale(), um die 5. bis 12. Spalte der Daten combine_WR zu skalieren. Nenne diesen Data Frame B und zeige ein paar Werte mit head() an.
Verwende prcomp(), um eine Hauptkomponentenanalyse auf den Daten durchzuführen, und fasse diese Analyse mit summary() zusammen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Subset combine only to "WR"
combine_WR <- subset(combine, position == "WR")

# Scale columns 5-12 of combine_WR
B <- ___(___[, ___])

# Print the first 6 rows of the data
___

# Summarize the principal component analysis
___(___)

Code bearbeiten und ausführen