ComeçarComece de graça

Análise de componentes principais

Nos últimos 2 capítulos, você viu várias formas de reduzir a dimensionalidade do seu conjunto de dados, incluindo regularização e seleção de atributos. É importante conseguir explicar diferentes aspectos de redução de dimensionalidade em uma entrevista de Machine Learning. Conjuntos de dados grandes demandam muito tempo de computação, e ruídos nos dados podem enviesar seus resultados.

Uma maneira de reduzir a dimensionalidade é a análise de componentes principais (PCA). É uma forma eficaz de reduzir o tamanho dos dados criando novos atributos que preservam as informações mais úteis do conjunto de dados enquanto removem a multicolinearidade. Neste exercício, você vai usar o módulo sklearn.decomposition para realizar PCA nas variáveis preditoras do conjunto diabetes, isolando a variável alvo progression.

Aqui é onde você está no pipeline:

Machine learning pipeline

Este exercício faz parte do curso

Praticando perguntas de entrevista de Machine Learning em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import module
from ____.____ import ____

# Feature matrix and target array
X = ____.____('____', axis=1)
y = ____['____']
Editar e executar o código