Resumindo a PCA no R
Como vimos no vídeo, havia uma variável categórica (posição) nos nossos dados que parecia se alinhar a aglomerados nos dois primeiros componentes principais. Mesmo ao padronizar os dados, esses dois CPs ainda explicam uma grande parte da variação. E se olhássemos apenas uma posição por vez?
Este exercício faz parte do curso
Álgebra Linear para Data Science em R
Instruções do exercício
Faça a mesma análise do exercício anterior, mas use somente o subconjunto em que a posição é igual a "WR" (wide receiver):
- Use a função
scale()para padronizar da 5ª até a 12ª coluna dos dadoscombine_WR. Dê a esse data frame o nomeBe mostre alguns valores comhead(). - Use
prcomp()para executar a análise de componentes principais nos dados e resuma essa análise usandosummary().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Subset combine only to "WR"
combine_WR <- subset(combine, position == "WR")
# Scale columns 5-12 of combine_WR
B <- ___(___[, ___])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
___(___)