Análise de componentes principais
Nos últimos 2 capítulos, você viu várias formas de reduzir a dimensionalidade do seu conjunto de dados, incluindo regularização e seleção de atributos. É importante conseguir explicar diferentes aspectos de redução de dimensionalidade em uma entrevista de Machine Learning. Conjuntos de dados grandes demandam muito tempo de computação, e ruídos nos dados podem enviesar seus resultados.
Uma maneira de reduzir a dimensionalidade é a análise de componentes principais (PCA). É uma forma eficaz de reduzir o tamanho dos dados criando novos atributos que preservam as informações mais úteis do conjunto de dados enquanto removem a multicolinearidade. Neste exercício, você vai usar o módulo sklearn.decomposition para realizar PCA nas variáveis preditoras do conjunto diabetes, isolando a variável alvo progression.
Aqui é onde você está no pipeline:

Este exercício faz parte do curso
Praticando perguntas de entrevista de Machine Learning em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import module
from ____.____ import ____
# Feature matrix and target array
X = ____.____('____', axis=1)
y = ____['____']