1. Nauka
  2. /
  3. Kursy
  4. /
  5. ETL i ELT w Pythonie

Connected

ćwiczenie

Walidacja potoku danych za pomocą assert

Aby tworzyć testy jednostkowe dla potoków danych, warto zapoznać się ze słowem kluczowym assert oraz funkcją isinstance(). W tym ćwiczeniu przećwiczysz użycie tych dwóch narzędzi do walidacji komponentów potoku danych.

Funkcje extract() i transform() są już dostępne, podobnie jak biblioteka pandas zaimportowana jako pd. Obie funkcje – extract() i transform() – zwracają DataFrame. Powodzenia!

Instrukcje 1/4

undefined XP
  • 1
    • Użyj assert, aby sprawdzić, czy DataFrame clean_tax_data ma pięć kolumn.
  • 2
    • Sprawdź, czy obiekt przechowywany w zmiennej clean_tax_data jest instancją pd.DataFrame.
  • 3
    • Użyj assert, aby potwierdzić, że wartość przechowywana w zmiennej clean_tax_data jest instancją pd.DataFrame.
  • 4
    • Spróbuj sprawdzić za pomocą assert, czy clean_tax_data ma typ str, i zaobserwuj wyjątek, który zostanie zgłoszony.