Aan de slagGa gratis aan de slag

Hoeveel componenten zijn relevant?

De resultaten die je in pcaNews hebt opgeslagen bevatten evenveel componenten als variabelen. Maar je doel is dimensiereductie. Tijd om te bepalen hoeveel componenten je moet extraheren. Gebruik meerdere benaderingen om je keuze te onderbouwen.

De resultaten van de PCA pcaNews staan nog in je werkruimte. Alle benodigde pakketten zijn geladen.

Deze oefening maakt deel uit van de cursus

Machine Learning for Marketing Analytics in R

Cursus bekijken

Oefeninstructies

  • Maak een screeplot. Hoeveel componenten stelt die voor?
  • Hoeveel componenten heb je nodig om aan het criterium van 70% verklaarde variantie te voldoen (bekijk de summary())?
  • Hoeveel componenten zou je extraheren volgens het Kaiser-Guttmann-criterium?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Screeplot:
___(___, type = ___)

# Cumulative explained variance:
___(___)

# Kaiser-Guttmann (number of components with eigenvalue larger than 1):
sum(pcaNews$___ > ___)
Code bewerken en uitvoeren