1. Learn
  2. /
  3. Courses
  4. /
  5. ETL i ELT w Pythonie

Connected

Exercise

Testowanie jednostkowe potoku danych z użyciem fixtures

Z poprzedniego materiału wiesz już, że testowanie jednostkowe zwiększa wiarygodność potoku danych i pomaga wychwytywać błędy na etapie tworzenia. W tym ćwiczeniu przećwiczysz pisanie fixtures oraz testów jednostkowych z użyciem biblioteki pytest i instrukcji assert.

Funkcja transform, wokół której napiszesz testy jednostkowe, jest pokazana poniżej dla odniesienia. Biblioteka pandas została zaimportowana jako pd, a biblioteka pytest jest załadowana i gotowa do użycia.

def transform(raw_data):
    raw_data["tax_rate"] = raw_data["total_taxes_paid"] / raw_data["total_taxable_income"]
    raw_data.set_index("industry_name", inplace=True)
    return raw_data

Instructions 1/2

undefined XP
    1
    2
  • Utwórz fixture pytest o nazwie clean_tax_data.
  • Zastosuj funkcję transform() do zbioru danych raw_data, zapisz wynik w zmiennej clean_data i zwróć go.