Een Dask bag maken
Je gaat reviews analyseren die op TripAdvisor zijn achtergelaten. Je collega heeft de reviews aangeleverd als een lijst met strings. Je wilt Dask gebruiken om je analyse te versnellen, dus je begint met het inladen van de data in een Dask bag.
Deze oefening maakt deel uit van de cursus
Parallel programmeren met Dask in Python
Oefeninstructies
- Importeer de subpackage
dask.bagalsdb. - Gebruik de functie
from_sequence()omreviews_listom te zetten naar een Dask bag met 3 partities. - Gebruik de
.take()-methode van de bag om één element uit de Dask bag te printen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the Dask bag subpackage as db
____
# Convert the list to a Dask bag
review_bag = db.____(____, ____=____)
# Print 1 element of the bag
print(____)