ComeçarComece de graça

Entendendo os componentes principais

A análise de componentes principais (PCA) reduz a dimensionalidade combinando informações de recursos que não se sobrepõem. A PCA extrai novos recursos chamados componentes principais, que são independentes entre si. Uma forma de entender a PCA é traçar os principais componentes nos eixos x e y e exibir os vetores de atributos. Isso permite ver quais recursos estão contribuindo para cada componente principal. Embora nem sempre seja fácil, é uma boa prática nomear os componentes principais com base nos recursos que contribuem para eles. No entanto, como método de extração de atributos, a PCA costuma ser difícil de interpretar.

Um subconjunto dos dados de crédito está em credit_df. A variável alvo é credit_score. Os pacotes tidyverse e ggfortify também já foram carregados para você.

Este exercício faz parte do curso

Redução de Dimensionalidade em R

Ver curso

Instruções do exercício

  • Realize a análise de componentes principais em credit_df.
  • Use autoplot() para exibir os dois primeiros componentes principais, os vetores e rótulos dos atributos, e codifique credit_score nas cores.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Perform PCA
pca_res <- ___(___ %>% select(-___), scale. = ___)

# Plot principal components and feature vectors
___(___, 
         data = ___, 
         colour = '___', 
         alpha = 0.3,
         loadings = ___, 
         loadings.label = ___, 
         loadings.colour = "black", 
         loadings.label.colour = "black")
Editar e executar o código