Este exercício faz parte do curso
Neste capítulo, você aprenderá exatamente o que significa pré-processar dados. Você dará os primeiros passos em qualquer jornada de pré-processamento, incluindo a exploração de tipos de dados e o tratamento de dados ausentes.
Este capítulo trata da padronização de dados. Geralmente, um modelo faz algumas suposições sobre a distribuição ou a escala de seus recursos. A padronização é uma maneira de fazer com que seus dados se ajustem a essas suposições e melhorem o desempenho do algoritmo.
Nesta seção, você aprenderá sobre engenharia de recursos. Você explorará diferentes maneiras de criar recursos novos e mais úteis a partir dos que já estão em seu conjunto de dados. Você verá como codificar, agregar e extrair informações de recursos numéricos e textuais.
Este capítulo aborda algumas técnicas diferentes para selecionar os recursos mais importantes do seu conjunto de dados. Você aprenderá a eliminar recursos redundantes, trabalhar com vetores de texto e reduzir o número de recursos em seu conjunto de dados usando a análise de componentes principais (PCA).
Agora que você já aprendeu tudo sobre pré-processamento, você testará essas técnicas em um conjunto de dados que registra informações sobre avistamentos de UFO.
Exercício atual