PCA samenvatten in R
Zoals we in de video zagen, zat er een categorische variabele (position) in onze data die overeenkwam met clusters in de eerste twee hoofdcomponenten. Zelfs na het schalen van de data verklaren deze twee PCs nog steeds een groot deel van de variantie in de data. Wat als we maar naar één positie tegelijk kijken?
Deze oefening maakt deel uit van de cursus
Lineaire algebra voor data science in R
Oefeninstructies
Voer dezelfde analyse uit als in de vorige oefening, maar gebruik alleen de subset van de data waarbij position gelijk is aan "WR" (wide receiver):
- Gebruik de functie
scale()om de 5e tot en met de 12e kolom van de datacombine_WRte schalen. Noem dit data frameBen laat een paar waarden zien methead(). - Gebruik
prcomp()om principal component analysis op de data uit te voeren en vat deze analyse samen metsummary().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Subset combine only to "WR"
combine_WR <- subset(combine, position == "WR")
# Scale columns 5-12 of combine_WR
B <- ___(___[, ___])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
___(___)