1. Apprendre
  2. /
  3. Cours
  4. /
  5. ETL et ELT en Python

Connected

Exercice

Tester un pipeline de données avec des fixtures

Dans la dernière vidéo, vous avez vu que les tests unitaires aident à renforcer la confiance envers votre pipeline de données et peuvent même permettre de repérer des bogues tout au long du développement. Dans cet exercice, vous allez vous exercer à écrire des fixtures et des tests unitaires, en utilisant la bibliothèque pytest et assert.

La fonction transform autour de laquelle vous allez créer des tests unitaires est présentée ci-dessous à titre de référence. pandas a été importé sous le nom pd, et la bibliothèque pytest() est chargée et prête à l'emploi.

def transform(raw_data):
    raw_data["tax_rate"] = raw_data["total_taxes_paid"] / raw_data["total_taxable_income"]
    raw_data.set_index("industry_name", inplace=True)
    return raw_data

Instructions 1/2

undefined XP
    1
    2
  • Créez une fixture pytest appelée clean_tax_data.
  • Appliquez la fonction transform() au jeu de données raw_data, enregistrez le résultat dans la variable clean_data et retournez-la.