Quante componenti sono rilevanti?
I risultati che hai salvato in pcaNews contengono tante componenti quante sono le variabili. Ma il tuo obiettivo è ridurre la dimensionalità. È il momento di capire quante componenti dovresti estrarre. Usa diversi approcci per prendere la tua decisione.
I risultati della PCA pcaNews sono ancora caricati nel tuo workspace. Tutti i pacchetti necessari sono caricati.
Questo esercizio fa parte del corso
Machine Learning per il Marketing Analytics in R
Istruzioni dell'esercizio
- Crea uno screeplot. Quante componenti suggerisce?
- Di quante componenti avresti bisogno per soddisfare il criterio del 70% di varianza spiegata (dai un’occhiata al
summary())? - Quante componenti estrarresti secondo il criterio di Kaiser-Guttmann?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Screeplot:
___(___, type = ___)
# Cumulative explained variance:
___(___)
# Kaiser-Guttmann (number of components with eigenvalue larger than 1):
sum(pcaNews$___ > ___)