1. Обучение
  2. /
  3. Курса
  4. /
  5. Parallel Programming with Dask in Python

Connected

упражнение

Vytvoření bag ze uložených textových souborů

Tentokrát tvůj kolega uložil recenze do textových souborů. Souborů je víc a každý obsahuje více recenzí. Každá recenze je na samostatném řádku.

Chceš je načíst do Dasku líně (lazily), abys mohl/a využít paralelní zpracování a analýzu urychlit.

dask.bag je již naimportován jako db.

Инструкции

100 XP
  • Pomocí funkce read_text() načti všechny soubory .txt ze složky data/tripadvisor_hotel_reviews.
  • Spočítej počet recenzí v bag.
  • Výsledek vypiš pomocí metody .compute().