PCA - dimensiereductie
In de vorige oefening werkte je met een gegevensset met twee variabelen. Tijdens een sollicitatie krijg je waarschijnlijk een grotere gegevensset.
Met PCA kun je het aantal variabelen verkleinen zonder veel informatie te verliezen.
PCA levert een gegevensset op van dezelfde omvang als je oorspronkelijke gegevensset. Jij bepaalt hoeveel variabelen je behoudt!
De volgende parameters van prcomp() verminderen het aantal dimensies op basis van:
tol- de standaardafwijking als percentage van de standaardafwijking van de eerste component,rank- het maximale aantal componenten.
De letters-gegevensset bevat numerieke kenmerken van letters.
Deze oefening maakt deel uit van de cursus
Oefenen met statistiek-vragen voor sollicitaties in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Perform PCA on letters
pca_letters <- ___(letters)
# Output spread measures of principal components
___(pca_letters)