Aan de slagGa gratis aan de slag

Een Dask bag maken

Je gaat reviews analyseren die op TripAdvisor zijn achtergelaten. Je collega heeft de reviews aangeleverd als een lijst met strings. Je wilt Dask gebruiken om je analyse te versnellen, dus je begint met het inladen van de data in een Dask bag.

Deze oefening maakt deel uit van de cursus

Parallel programmeren met Dask in Python

Cursus bekijken

Oefeninstructies

  • Importeer de subpackage dask.bag als db.
  • Gebruik de functie from_sequence() om reviews_list om te zetten naar een Dask bag met 3 partities.
  • Gebruik de .take()-methode van de bag om één element uit de Dask bag te printen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the Dask bag subpackage as db
____

# Convert the list to a Dask bag
review_bag = db.____(____, ____=____)

# Print 1 element of the bag
print(____)
Code bewerken en uitvoeren