Quantos componentes são relevantes?
Os resultados que você armazenou em pcaNews contêm tantos componentes quanto variáveis. Mas seu objetivo é reduzir a dimensionalidade. É hora de descobrir quantos componentes você deve extrair. Use várias abordagens para tomar sua decisão.
Os resultados do PCA pcaNews ainda estão carregados no seu ambiente. Todos os pacotes necessários estão carregados.
Este exercício faz parte do curso
Machine Learning for Marketing Analytics in R
Instruções do exercício
- Crie um screeplot. Quantos componentes ele sugere?
- Quantos componentes seriam necessários para atender ao critério de 70% da variância explicada (dê uma olhada no
summary())? - Quantos componentes você extrairia de acordo com o critério de Kaiser-Guttmann?
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Screeplot:
___(___, type = ___)
# Cumulative explained variance:
___(___)
# Kaiser-Guttmann (number of components with eigenvalue larger than 1):
sum(pcaNews$___ > ___)