Executando PCA
A próxima etapa da sua análise é executar PCA em wisc.data.
Você viu no último capítulo que é importante verificar se os dados precisam ser escalonados antes de executar o PCA. Relembre dois motivos comuns para escalonar dados:
- As variáveis de entrada usam unidades de medida diferentes.
- As variáveis de entrada têm variâncias significativamente diferentes.
Este exercício faz parte do curso
Aprendizado não supervisionado em R
Instruções do exercício
As variáveis que você criou antes, wisc.data e diagnosis, ainda estão disponíveis no seu ambiente de trabalho.
- Verifique a média e o desvio padrão das features dos dados para decidir se é preciso escalonar. Use as funções
colMeans()eapply()como você fez antes. - Execute o PCA em
wisc.data, escalonando se for apropriado, e atribua o modelo awisc.pr. - Inspecione um resumo dos resultados com a função
summary().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Check column means and standard deviations
# Execute PCA, scaling if appropriate: wisc.pr
# Look at summary of results