or
Este exercício faz parte do curso
Neste capítulo, você vai explorar o que é engenharia de atributos e como começar a aplicá-la em dados do mundo real. Você vai carregar, explorar e visualizar um conjunto de respostas de pesquisa e, com isso, entender os tipos de dados subjacentes e por que eles influenciam a forma como você deve criar seus atributos. Usando o pacote pandas, você vai criar novos atributos a partir de colunas categóricas e contínuas.
Este capítulo apresenta a realidade de dados bagunçados e incompletos. Você vai aprender a encontrar onde seus dados têm valores ausentes e explorar várias abordagens para tratá-los. Você também usará técnicas de manipulação de strings para lidar com caracteres indesejados no seu conjunto de dados.
Neste capítulo, o foco é analisar a distribuição subjacente dos seus dados e se ela impactará seu pipeline de Machine Learning. Você vai aprender a lidar com dados assimétricos e situações em que outliers podem estar prejudicando sua análise.
Por fim, neste capítulo, você vai trabalhar com dados de texto não estruturados, entendendo maneiras de extrair atributos em colunas a partir de um corpus de texto. Você vai comparar como diferentes abordagens podem impactar o quanto de contexto é extraído de um texto e como equilibrar a necessidade de contexto sem criar atributos em excesso.
Exercício atual