1. Nauka
  2. /
  3. Kursy
  4. /
  5. Programowanie równoległe z Dask w Pythonie

Connected

ćwiczenie

Tworzenie worka z zapisanych plików tekstowych

Tym razem twój współpracownik zapisał recenzje w plikach tekstowych. Jest kilka plików, a każdy z nich zawiera wiele recenzji. Każda recenzja zajmuje osobny wiersz w pliku.

Chcesz wczytać te pliki do Daska w trybie leniwym, aby móc szybciej je analizować dzięki przetwarzaniu równoległemu.

dask.bag został już zaimportowany jako db.

Instrukcje

100 XP
  • Użyj funkcji read_text(), aby wczytać wszystkie pliki .txt z katalogu data/tripadvisor_hotel_reviews.
  • Policz liczbę recenzji w worku.
  • Użyj metody .compute() na worku, aby wyświetlić wynik.