Wie viele Komponenten sind relevant?
Die Ergebnisse, die du in pcaNews gespeichert hast, enthalten so viele Komponenten wie Variablen. Dein Ziel ist jedoch eine Dimensionsreduktion. Es ist Zeit herauszufinden, wie viele Komponenten du extrahieren solltest. Nutze mehrere Ansätze, um deine Entscheidung zu treffen.
Die Ergebnisse der PCA pcaNews sind noch in deinem Workspace geladen. Alle notwendigen Pakete sind geladen.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing-Analytics in R
Anleitung zur Übung
- Erstelle ein Screeplot. Wie viele Komponenten werden vorgeschlagen?
- Wie viele Komponenten brauchst du, um das Kriterium von 70 % erklärter Varianz zu erreichen (schau dir das
summary()an)? - Wie viele Komponenten würdest du nach dem Kaiser-Guttman-Kriterium extrahieren?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Screeplot:
___(___, type = ___)
# Cumulative explained variance:
___(___)
# Kaiser-Guttmann (number of components with eigenvalue larger than 1):
sum(pcaNews$___ > ___)