1. Učit se
  2. /
  3. Kurzy
  4. /
  5. ETL a ELT v Pythonu

Connected

cvičení

Validace datového pipeline pomocí assert

Pro psaní unit testů datových pipeline je důležité seznámit se s klíčovým slovem assert a funkcí isinstance(). V tomto cvičení si procvičíš použití těchto dvou nástrojů k validaci komponent datového pipeline.

Máš k dispozici funkce extract() a transform(), a také pandas importovaný jako pd. Obě funkce extract() i transform() vrací DataFrame. Hodně štěstí!

Instrukce 1/4

undefined XP
  • 1
    • Pomocí assert ověř, že DataFrame clean_tax_data má pět sloupců.
  • 2
    • Ověř, že objekt uložený v proměnné clean_tax_data je instancí pd.DataFrame.
  • 3
    • Pomocí assert ověř, že hodnota uložená v proměnné clean_tax_data je instancí pd.DataFrame.
  • 4
    • Zkus pomocí assert ověřit, že clean_tax_data má typ str, a sleduj, jaká výjimka nastane.