1. Učit se
  2. /
  3. Kurzy
  4. /
  5. ETL a ELT v Pythonu

Connected

Cvičení

Extrakce dat z parquet souborů

Jedním z nejběžnějších způsobů, jak načíst data ze zdrojového systému, je čtení ze souboru – například CSV. S rostoucím objemem dat vznikla potřeba efektivnějších formátů, a tak přišly sloupcově orientované typy souborů, jako jsou parquet soubory.

V tomto cvičení si procvičíš extrakci dat z parquet souboru.

Pokyny

100 XP
  • Načti parquet soubor z cesty "sales_data.parquet" do DataFramu pandas.
  • Pomocí print() vypiš datové typy sloupců DataFramu.
  • Zobraz tvar DataFramu a jeho prvních několik řádků.