or
Este exercício faz parte do curso
Neste capítulo, você vai entender exatamente o que significa pré-processar dados. Você dará os primeiros passos em qualquer jornada de pré-processamento, incluindo explorar tipos de dados e lidar com valores ausentes.
Este capítulo é totalmente sobre padronizar dados. Muitas vezes, um modelo faz algumas suposições sobre a distribuição ou a escala das suas variáveis. A padronização é uma forma de fazer seus dados atenderem a essas suposições e melhorar o desempenho do algoritmo.
Nesta seção, você vai aprender sobre engenharia de atributos. Você vai explorar diferentes maneiras de criar variáveis novas e mais úteis a partir das que já estão no seu conjunto de dados. Você verá como codificar, agregar e extrair informações de atributos numéricos e textuais.
Este capítulo apresenta algumas técnicas para selecionar as variáveis mais importantes do seu conjunto de dados. Você vai aprender a remover variáveis redundantes, trabalhar com vetores de texto e reduzir a quantidade de variáveis usando a análise de componentes principais (PCA).
Agora que você aprendeu tudo sobre pré-processamento, vai aplicar essas técnicas em um conjunto de dados que registra informações sobre avistamentos de OVNIs.
Exercício atual