Quantos componentes são relevantes?
Os resultados que você armazenou em pcaNews contêm tantos componentes quanto variáveis. Mas seu objetivo é reduzir a dimensionalidade. É hora de descobrir quantos componentes você deve extrair. Use várias abordagens para tomar sua decisão.
Os resultados do PCA pcaNews ainda estão carregados no seu ambiente. Todos os pacotes necessários estão carregados.
Este exercicio faz parte do curso
Machine Learning for Marketing Analytics in R
Instruções do exercicio
- Crie um screeplot. Quantos componentes ele sugere?
- Quantos componentes seriam necessários para atender ao critério de 70% da variância explicada (dê uma olhada no
summary())? - Quantos componentes você extrairia de acordo com o critério de Kaiser-Guttmann?
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Screeplot:
___(___, type = ___)
# Cumulative explained variance:
___(___)
# Kaiser-Guttmann (number of components with eigenvalue larger than 1):
sum(pcaNews$___ > ___)