PCA samenvatten in R

Zoals we in de video zagen, zat er een categorische variabele (position) in onze data die overeenkwam met clusters in de eerste twee hoofdcomponenten. Zelfs na het schalen van de data verklaren deze twee PCs nog steeds een groot deel van de variantie in de data. Wat als we maar naar één positie tegelijk kijken?

Deze oefening maakt deel uit van de cursus

Lineaire algebra voor data science in R

Bekijk cursus

Oefeninstructies

Voer dezelfde analyse uit als in de vorige oefening, maar gebruik alleen de subset van de data waarbij position gelijk is aan "WR" (wide receiver):

Gebruik de functie scale() om de 5e tot en met de 12e kolom van de data combine_WR te schalen. Noem dit data frame B en laat een paar waarden zien met head().
Gebruik prcomp() om principal component analysis op de data uit te voeren en vat deze analyse samen met summary().

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Subset combine only to "WR"
combine_WR <- subset(combine, position == "WR")

# Scale columns 5-12 of combine_WR
B <- ___(___[, ___])

# Print the first 6 rows of the data
___

# Summarize the principal component analysis
___(___)

Code bewerken en uitvoeren