1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Parallel Programming with Dask in Python

Connected

cvičení

Vytváření Dask DataFrames z CSV souborů

Dřív jsi analyzoval/a data skladeb ze Spotify pomocí smyček a odložených funkcí. Teď už víš, že totéž zvládneš snáz s Dask DataFrame. Podívejme se, o kolik jednodušší jsou stejné úkoly, když místo smyček použiješ tyto metody. Nejdřív ale budeš muset dataset načíst do Dask DataFrame.

Pokyny

100 XP
  • Naimportuj subbalíček dask.dataframe jako dd.
  • Načti všechny CSV soubory ve složce data/spotify s maximální velikostí bloku 1 MB.
  • Pomocí funkce dd.to_datetime() převeď řetězce ve sloupci 'release_date' na hodnoty datetime.
  • Pomocí metody .head() zobraz 5 řádků tabulky.