1. Učit se
  2. /
  3. Kurzy
  4. /
  5. ETL a ELT v Pythonu

Connected

Cvičení

Filtrování DataFramů v pandas

Jakmile jsou data extrahována ze zdrojového systému, přichází čas na jejich transformaci! Zdrojová data často obsahují více informací, než je pro další využití potřeba. V takovém případě je vhodné snížit dimenzionalitu dat ve fázi „transform" datového pipeline.

pandas je importován jako pd a funkce extract() je k dispozici pro načtení DataFrame z předané cesty.

Pokyny

100 XP
  • Pomocí funkce extract() načti DataFrame uložený na cestě "sales_data.parquet".
  • Uprav funkci transform() tak, aby vrátila všechny řádky a sloupce, kde je "Quantity Ordered" větší než 1.
  • Dále filtruj DataFrame clean_data tak, aby obsahoval pouze sloupce "Order Date", "Quantity Ordered" a "Purchase Address".
  • Vrať filtrovaný DataFrame.