1. Learn
  2. /
  3. Курси
  4. /
  5. ETL et ELT en Python

Connected

вправа

Écrire des tests unitaires avec pytest

Dans cet exercice, vous allez vous exercer à écrire un test unitaire pour valider un pipeline de données. Vous utiliserez assert et d'autres outils pour construire les tests et déterminer si le pipeline se comporte comme prévu.

Les fonctions extract() et transform() sont déjà à votre disposition, ainsi que pandas, importé sous l'alias pd. Vous testerez la fonction transform(), présentée ci-dessous.

def transform(raw_data):
    raw_data["average_taxable_income"] = raw_data["total_taxable_income"] / raw_data["number_of_firms"]
    clean_data = raw_data.loc[raw_data["average_taxable_income"] > 100, :]
    clean_data.set_index("industry_name", inplace=True)
    return clean_data

Інструкції

100 XP
  • Importez la bibliothèque pytest.
  • Vérifiez, avec une assertion, que la valeur stockée dans la variable clean_tax_data est une instance de pd.DataFrame.
  • Validez que le nombre de colonnes dans le DataFrame clean_tax_data est supérieur au nombre de colonnes du DataFrame raw_tax_data.