Aan de slagBegin gratis

Een Dask bag maken

Je gaat reviews analyseren die op TripAdvisor zijn achtergelaten. Je collega heeft de reviews aangeleverd als een lijst met strings. Je wilt Dask gebruiken om je analyse te versnellen, dus je begint met het inladen van de data in een Dask bag.

Deze oefening maakt deel uit van de cursus

Parallel programmeren met Dask in Python

Bekijk cursus

Oefeninstructies

  • Importeer de subpackage dask.bag als db.
  • Gebruik de functie from_sequence() om reviews_list om te zetten naar een Dask bag met 3 partities.
  • Gebruik de .take()-methode van de bag om één element uit de Dask bag te printen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import the Dask bag subpackage as db
____

# Convert the list to a Dask bag
review_bag = db.____(____, ____=____)

# Print 1 element of the bag
print(____)
Code bewerken en uitvoeren