1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Parallel Programming with Dask in Python

Connected

cvičení

Analýza skladeb na Spotify

Máš k dispozici seznam CSV souborů, které chceš agregovat a prozkoumat katalog hudby na Spotify. Důležité je, aby celý proces proběhl rychle a využil veškerý dostupný výpočetní výkon.

Každý CSV soubor obsahuje všechny skladby vydané v daném roce a každý řádek popisuje jednu konkrétní skladbu.

dask a delayed() jsou již naimportovány a seznam názvů souborů je dostupný v prostředí jako filenames. pandas je naimportován jako pd.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Pomocí odložené (delayed) verze funkce pd.read_csv() načti každý soubor jako DataFrame.