ComeçarComece de graça

Variância explicada

Neste exercício, você vai gerar gráficos de scree mostrando a proporção de variância explicada conforme o número de componentes principais aumenta. Os dados da PCA precisam ser preparados para esses gráficos, já que não há uma função nativa em R que os crie diretamente a partir do modelo de PCA.

Ao analisar esses gráficos, veja se há um “cotovelo” na quantidade de variância explicada que possa indicar um número natural de componentes principais. Se não houver um cotovelo óbvio, como costuma acontecer em conjuntos de dados do mundo real, pense em outras formas de decidir quantos componentes principais manter com base no gráfico de scree.

Este exercício faz parte do curso

Aprendizado não supervisionado em R

Ver curso

Instruções do exercício

As variáveis que você criou antes, wisc.data, diagnosis e wisc.pr, ainda estão disponíveis.

  • Calcule a variância de cada componente principal elevando ao quadrado o elemento sdev de wisc.pr. Salve o resultado em um objeto chamado pr.var.
  • Calcule a variância explicada por cada componente principal dividindo pela variância total explicada de todos os componentes principais. Atribua isso a uma variável chamada pve.
  • Crie um gráfico da variância explicada para cada componente principal.
  • Usando a função cumsum(), crie um gráfico da proporção cumulativa de variância explicada.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Set up 1 x 2 plotting grid
par(mfrow = c(1, 2))

# Calculate variability of each component


# Variance explained by each principal component: pve


# Plot variance explained for each principal component
plot(___, xlab = "Principal Component", 
     ylab = "Proportion of Variance Explained", 
     ylim = c(0, 1), type = "b")

# Plot cumulative proportion of variance explained
plot(___, xlab = "Principal Component", 
     ylab = "Cumulative Proportion of Variance Explained", 
     ylim = c(0, 1), type = "b")
Editar e executar o código