1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. ETL và ELT với Python

Connected

Bài tập

Viết unit test với pytest

Trong bài tập này, bạn sẽ luyện viết một unit test để kiểm định một data pipeline. Bạn sẽ dùng assert và các công cụ khác để xây dựng các bài kiểm thử, và xác định liệu data pipeline có hoạt động đúng như mong đợi hay không.

Các hàm extract() và transform() đã được cung cấp sẵn cho bạn, cùng với pandas đã được import là pd. Bạn sẽ kiểm thử hàm transform(), được hiển thị bên dưới.

def transform(raw_data):
    raw_data["average_taxable_income"] = raw_data["total_taxable_income"] / raw_data["number_of_firms"]
    clean_data = raw_data.loc[raw_data["average_taxable_income"] > 100, :]
    clean_data.set_index("industry_name", inplace=True)
    return clean_data

Hướng dẫn

100 XP
  • Import thư viện pytest.
  • Khẳng định rằng giá trị lưu trong biến clean_tax_data là một instance của pd.DataFrame.
  • Xác nhận rằng số lượng cột trong DataFrame clean_tax_data lớn hơn số lượng cột trong DataFrame raw_tax_data.