or
Cet exercice fait partie du cours
Ce chapitre vous apprend les bases de Dask et de l’évaluation paresseuse. À la fin, vous saurez accélérer presque tout code Python grâce au traitement parallèle ou au multithreading. Vous découvrirez la différence entre ces deux méthodes d’ordonnancement des tâches et dans quels cas chacune est la plus adaptée.
Vous allez apprendre à analyser de grandes données structurées avec des tableaux Dask et des DataFrames Dask. Vous verrez comment tout ce que vous connaissez de NumPy et de pandas s’applique facilement à des données trop volumineuses pour tenir en mémoire.
Traitez n’importe quel type de données. Vous verrez comment les Dask bags permettent de traiter efficacement des textes non structurés, des données JSON semi-structurées, et même des enregistrements audio.
Exploitez la puissance de Dask pour entraîner des modèles de Machine Learning. Vous apprendrez à entraîner des modèles de Machine Learning sur de grands volumes de données avec le package Dask-ML, et à répartir les calculs Dask entre processus et threads pour gagner encore en vitesse de calcul.
Exercice en cours