1. Učit se
  2. /
  3. Kurzy
  4. /
  5. ETL a ELT v Pythonu

Connected

Cvičení

Unit testování datového pipeline s fixtures

V předchozím videu jsi se dozvěděl/a, že unit testování pomáhá zvýšit důvěryhodnost datového pipeline a odhalit chyby už během vývoje. V tomto cvičení si procvičíš psaní fixtures i unit testů pomocí knihovny pytest a příkazu assert.

Funkce transform, pro kterou budeš unit testy psát, je uvedena níže jako reference. Knihovna pandas je importována jako pd a knihovna pytest je načtena a připravena k použití.

def transform(raw_data):
    raw_data["tax_rate"] = raw_data["total_taxes_paid"] / raw_data["total_taxable_income"]
    raw_data.set_index("industry_name", inplace=True)
    return raw_data

Pokyny 1/2

undefined XP
    1
    2
  • Vytvoř pytest fixture s názvem clean_tax_data.
  • Aplikuj funkci transform() na datovou sadu raw_data, výsledek ulož do proměnné clean_data a vrať ji.