LoslegenKostenlos starten

Einen Bag aus gespeichertem Text erstellen

Diesmal hat deine Kollegin/dein Kollege die Rezensionen in einigen Textdateien gespeichert. Es gibt mehrere Dateien und mehrere Rezensionen pro Datei. Jede Rezension steht in der Textdatei in einer eigenen Zeile.

Du möchtest sie mit Dask lazy laden, damit du die Analyse mit Parallelverarbeitung schneller durchführen kannst.

dask.bag wurde für dich als db importiert.

Diese Übung ist Teil des Kurses

<Kurs>Parallele Programmierung mit Dask in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Verwende die Funktion read_text(), um alle .txt-Dateien im Verzeichnis data/tripadvisor_hotel_reviews zu laden.
  • Zähle die Anzahl der Rezensionen im Bag.
  • Verwende die .compute()-Methode des Bags, um die Antwort auszugeben.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Load in all the .txt files inside data/tripadvisor_hotel_reviews
review_bag = ____

# Count the number of reviews in the bag
review_count = review_bag.____

# Compute and print the answer
print(____)
Code bearbeiten und ausführen