1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. ETL và ELT với Python

Connected

Bài tập

Xác thực một data pipeline với assert

Để xây dựng unit test cho data pipeline, bạn cần làm quen với từ khóa assert và hàm isinstance(). Trong bài tập này, bạn sẽ luyện dùng hai công cụ này để xác thực các thành phần của một data pipeline.

Các hàm extract() và transform() đã được cung cấp cho bạn, cùng với pandas đã được import là pd. Cả extract() và transform() đều trả về một DataFrame. Chúc bạn thành công!

Hướng dẫn 1/4

undefined XP
  • 1
    • Khẳng định (assert) rằng DataFrame clean_tax_data có năm cột.
  • 2
    • Xác thực rằng đối tượng lưu trong biến clean_tax_data là một thể hiện (instance) của pd.DataFrame.
  • 3
    • Khẳng định rằng giá trị lưu trong biến clean_tax_data là một instance của pd.DataFrame.
  • 4
    • Hãy thử assert rằng clean_tax_data có kiểu str, và quan sát ngoại lệ được ném ra.