Este exercício faz parte do curso
Iniciaremos o curso definindo o que é ciência de dados. Abordaremos o fluxo de trabalho da ciência de dados e como ela é aplicada a problemas do mundo real. Finalizaremos o capítulo aprendendo sobre as diferentes funções no campo da ciência de dados.
Exercício atual
Agora que entendemos o fluxo de trabalho da ciência de dados, vamos nos aprofundar na primeira etapa: coleta e armazenamento de dados. Aprenderemos sobre as diferentes fontes de dados que podem ser utilizadas, a aparência desses dados, como armazená-los depois de coletados e como um pipeline de dados pode automatizar o processo.
A preparação dos dados é fundamental: os cientistas de dados passam 80% do tempo limpando e manipulando dados e apenas 20% do tempo analisando-os de fato. Este capítulo mostrará como diagnosticar problemas em seus dados e lidar com valores faltantes ou discrepantes. Em seguida, você aprenderá sobre visualização, outra ferramenta essencial para explorar seus dados e comunicar suas descobertas.
Neste capítulo final, discutiremos a experimentação e a previsão. Começando com experimentos, abordaremos o teste A/B e passaremos para a previsão de séries temporais, onde aprenderemos a prever eventos futuros. Por fim, terminaremos com o aprendizado de máquina, analisando o aprendizado supervisionado e o agrupamento.