or
Este exercício faz parte do curso
Este capítulo vai ensinar o básico de Dask e avaliação preguiçosa (lazy evaluation). Ao final, você será capaz de acelerar quase qualquer código Python usando processamento paralelo ou multithreading. Você vai aprender a diferença entre esses dois métodos de agendamento de tarefas e qual é melhor em cada situação.
Aqui você vai aprender a analisar grandes conjuntos de dados estruturados usando Dask arrays e Dask DataFrames. Você verá como tudo o que sabe sobre NumPy e pandas pode ser aplicado facilmente a dados que são grandes demais para caber na memória.
Exercício atual
Processe qualquer tipo de dado. Você vai aprender como Dask bags podem ser usadas para processar com eficiência dados de texto não estruturados, dados JSON semiestruturados e até áudios gravados.
Aproveite o poder do Dask para treinar modelos de Machine Learning. Você vai aprender a treinar modelos de Machine Learning em big data usando o pacote Dask-ML e como dividir cálculos do Dask entre uma mistura de processos e threads para obter ainda mais velocidade de computação.