or
Este exercício faz parte do curso
Você será apresentado ao conceito de redução de dimensionalidade e vai aprender quando e por que isso é importante. Vai aprender a diferença entre seleção de variáveis e extração de características e aplicará ambas as técnicas para explorar dados. O capítulo termina com uma lição sobre t-SNE, uma poderosa técnica de extração que permite visualizar um conjunto de dados de alta dimensão.
Exercício atual
Neste primeiro de dois capítulos sobre seleção de variáveis, você vai aprender sobre a “maldição da dimensionalidade” e como a redução de dimensionalidade pode ajudar a superá-la. Você conhecerá várias técnicas para detectar e remover variáveis que agregam pouco valor ao conjunto de dados, seja porque têm pouca variância, muitos valores ausentes ou porque são fortemente correlacionadas a outras variáveis.
Neste segundo capítulo sobre seleção de variáveis, você vai aprender a usar modelos para encontrar as variáveis mais importantes de um conjunto de dados para prever um alvo específico. Na lição final, você combinará as recomendações de vários modelos diferentes para decidir quais variáveis valem a pena manter.
Este capítulo é um mergulho profundo no algoritmo de redução de dimensionalidade mais usado, a Análise de Componentes Principais (PCA). Você vai construir intuição sobre como e por que esse algoritmo é tão poderoso e vai aplicá-lo tanto para exploração de dados quanto para pré-processamento em um pipeline de modelagem. Você termina com um caso de uso interessante de compactação de imagens.