Hoeveel componenten zijn relevant?
De resultaten die je in pcaNews hebt opgeslagen bevatten evenveel componenten als variabelen. Maar je doel is dimensiereductie. Tijd om te bepalen hoeveel componenten je moet extraheren. Gebruik meerdere benaderingen om je keuze te onderbouwen.
De resultaten van de PCA pcaNews staan nog in je werkruimte. Alle benodigde pakketten zijn geladen.
Deze oefening maakt deel uit van de cursus
Machine Learning for Marketing Analytics in R
Oefeninstructies
- Maak een screeplot. Hoeveel componenten stelt die voor?
- Hoeveel componenten heb je nodig om aan het criterium van 70% verklaarde variantie te voldoen (bekijk de
summary())? - Hoeveel componenten zou je extraheren volgens het Kaiser-Guttmann-criterium?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Screeplot:
___(___, type = ___)
# Cumulative explained variance:
___(___)
# Kaiser-Guttmann (number of components with eigenvalue larger than 1):
sum(pcaNews$___ > ___)