or
Este exercício faz parte do curso
Os dados brutos nem sempre vêm na melhor forma para análise. Neste capítulo de abertura, você vai dar uma primeira olhada em como transformar e criar features que aumentam o desempenho e a interpretabilidade do seu modelo.
Neste capítulo, você vai aprender que, além de transformar features manualmente, pode aproveitar ferramentas do tidyverse para criar novas variáveis de forma programática. Você vai explorar como essa abordagem melhora a reprodutibilidade dos seus modelos e é especialmente útil ao lidar com conjuntos de dados com muitas features.
Agora você vai aprender como os modelos frequentemente se beneficiam da redução de dimensionalidade e da extração de features de dados de alta dimensão, incluindo converter dados de texto em valores numéricos, codificar dados categóricos e ranquear o poder preditivo das variáveis. Você vai explorar métodos como análise de componentes principais, kernel principal component analysis, extração numérica de texto, codificações categóricas e escores de importância de variáveis.
Você vai encerrar o curso aprendendo sobre técnicas de feature engineering e Machine Learning. Primeiro, o foco será nos problemas de usar todas as features disponíveis em um modelo e na importância de identificar features irrelevantes e redundantes e aprender a removê-las usando métodos embutidos como lasso e elastic-net. Em seguida, você vai explorar métodos de shrinkage como lasso, ridge e elastic-net, que podem ser usados para regularizar pesos das features ou selecionar features ao zerar coeficientes. Por fim, você vai finalizar criando um fluxo de trabalho de feature engineering de ponta a ponta e revisando e praticando os conceitos e funções aprendidos em um pequeno projeto.
Exercício atual