1. Apprendre
  2. /
  3. Cours
  4. /
  5. ETL et ELT en Python

Connected

Exercice

Valider un pipeline de données avec assert

Pour écrire des tests unitaires pour des pipelines de données, il est important de bien connaître le mot-clé assert et la fonction isinstance(). Dans cet exercice, vous pratiquerez l'utilisation de ces deux outils pour valider des composants d'un pipeline de données.

Les fonctions extract() et transform() sont mises à votre disposition, ainsi que pandas, importé sous le nom pd. extract() et transform() renvoient toutes deux un DataFrame. Bonne chance !

Instructions 1/4

undefined XP
  • 1
    • Vérifiez avec assert que le DataFrame clean_tax_data contient cinq colonnes.
  • 2
    • Validez que l'objet stocké dans la variable clean_tax_data est une instance de pd.DataFrame.
  • 3
    • Vérifiez avec assert que la valeur stockée dans la variable clean_tax_data est une instance de pd.DataFrame.
  • 4
    • Essayez d'affirmer avec assert que clean_tax_data est de type str, et observez l'exception.