or
Deze oefening maakt deel uit van de cursus
In dit hoofdstuk leer je de basis van Dask en lui evalueren. Aan het eind kun je bijna elke Python-code versnellen met parallel processing of multithreading. Je leert het verschil tussen deze twee manieren van taakplanning en wanneer welke beter werkt.
Hier leer je hoe je grote, gestructureerde data analyseert met Dask-arrays en Dask DataFrames. Je ziet hoe alles wat je kent van NumPy en pandas eenvoudig toepasbaar is op data die te groot is voor het geheugen.
Huidige oefening
Verwerk elk type data. Je leert hoe Dask bags efficiënt kunnen worden gebruikt voor ongestructureerde tekstdata, semigestructureerde JSON-data en zelfs opgenomen audio.
Benut de kracht van Dask om Machine Learning-modellen te trainen. Je leert hoe je met het Dask-ML-pakket modellen op big data traint, en hoe je Dask-berekeningen over een mix van processen en threads verdeelt voor nog meer snelheid.