Aan de slagGa gratis aan de slag

PCA - dimensiereductie

In de vorige oefening werkte je met een gegevensset met twee variabelen. Tijdens een sollicitatie krijg je waarschijnlijk een grotere gegevensset.

Met PCA kun je het aantal variabelen verkleinen zonder veel informatie te verliezen.

PCA levert een gegevensset op van dezelfde omvang als je oorspronkelijke gegevensset. Jij bepaalt hoeveel variabelen je behoudt!

De volgende parameters van prcomp() verminderen het aantal dimensies op basis van:

  • tol - de standaardafwijking als percentage van de standaardafwijking van de eerste component,
  • rank - het maximale aantal componenten.

De letters-gegevensset bevat numerieke kenmerken van letters.

Deze oefening maakt deel uit van de cursus

Oefenen met statistiek-vragen voor sollicitaties in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Perform PCA on letters
pca_letters <- ___(letters)

# Output spread measures of principal components
___(pca_letters)
Code bewerken en uitvoeren