Entendendo os componentes principais
A análise de componentes principais (PCA) reduz a dimensionalidade combinando informações de recursos que não se sobrepõem. A PCA extrai novos recursos chamados componentes principais, que são independentes entre si. Uma forma de entender a PCA é traçar os principais componentes nos eixos x e y e exibir os vetores de atributos. Isso permite ver quais recursos estão contribuindo para cada componente principal. Embora nem sempre seja fácil, é uma boa prática nomear os componentes principais com base nos recursos que contribuem para eles. No entanto, como método de extração de atributos, a PCA costuma ser difícil de interpretar.
Um subconjunto dos dados de crédito está em credit_df. A variável alvo é credit_score. Os pacotes tidyverse e ggfortify também já foram carregados para você.
Este exercício faz parte do curso
Redução de Dimensionalidade em R
Instruções do exercício
- Realize a análise de componentes principais em
credit_df. - Use
autoplot()para exibir os dois primeiros componentes principais, os vetores e rótulos dos atributos, e codifiquecredit_scorenas cores.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform PCA
pca_res <- ___(___ %>% select(-___), scale. = ___)
# Plot principal components and feature vectors
___(___,
data = ___,
colour = '___',
alpha = 0.3,
loadings = ___,
loadings.label = ___,
loadings.colour = "black",
loadings.label.colour = "black")