1. Nauka
  2. /
  3. Kursy
  4. /
  5. ETL i ELT w Pythonie

Connected

ćwiczenie

Pisanie testów jednostkowych z pytest

W tym ćwiczeniu przećwiczysz pisanie testów jednostkowych do walidacji potoku danych. Użyjesz assert i innych narzędzi, aby zbudować testy i sprawdzić, czy potok danych działa poprawnie.

Funkcje extract() i transform() są już dostępne, podobnie jak biblioteka pandas zaimportowana jako pd. Będziesz testować funkcję transform(), która wygląda następująco.

def transform(raw_data):
    raw_data["average_taxable_income"] = raw_data["total_taxable_income"] / raw_data["number_of_firms"]
    clean_data = raw_data.loc[raw_data["average_taxable_income"] > 100, :]
    clean_data.set_index("industry_name", inplace=True)
    return clean_data

Instrukcje

100 XP
  • Zaimportuj bibliotekę pytest.
  • Sprawdź za pomocą assert, czy wartość przechowywana w zmiennej clean_tax_data jest instancją pd.DataFrame.
  • Zweryfikuj, czy liczba kolumn w ramce danych clean_tax_data jest większa niż liczba kolumn w ramce danych raw_tax_data.