1. Učit se
  2. /
  3. Kurzy
  4. /
  5. ETL a ELT v Pythonu

Connected

cvičení

Psaní unit testů s pytest

V tomto cvičení si procvičíš psaní unit testu pro ověření datového pipeline. Ke stavbě testů použiješ assert a další nástroje a zjistíš, zda pipeline funguje správně.

Máš k dispozici funkce extract() a transform() a také knihovnu pandas importovanou jako pd. Testovat budeš funkci transform(), která je uvedena níže.

def transform(raw_data):
    raw_data["average_taxable_income"] = raw_data["total_taxable_income"] / raw_data["number_of_firms"]
    clean_data = raw_data.loc[raw_data["average_taxable_income"] > 100, :]
    clean_data.set_index("industry_name", inplace=True)
    return clean_data

Pokyny

100 XP
  • Importuj knihovnu pytest.
  • Ověř pomocí assert, že hodnota uložená v proměnné clean_tax_data je instancí pd.DataFrame.
  • Zkontroluj, že počet sloupců v DataFrame clean_tax_data je větší než počet sloupců uložených v DataFrame raw_tax_data.