1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 Python 的 ETL 和 ELT

Connected

道练习

使用 fixtures 对数据管道进行单元测试

您在上一段视频中了解到,单元测试可以帮助增强对数据管道的信任,并且还能在开发过程中捕获缺陷。此练习中,您将使用 pytest 库和 assert,练习编写 fixtures 和单元测试。

下面展示了您将围绕其编写单元测试的 transform 函数,供参考。已将 pandas 导入为 pd,并已加载 pytest() 库,随时可用。

def transform(raw_data):
    raw_data["tax_rate"] = raw_data["total_taxes_paid"] / raw_data["total_taxable_income"]
    raw_data.set_index("industry_name", inplace=True)
    return raw_data

说明 1 / 共 2 个

undefined XP
    1
    2
  • 创建名为 clean_tax_data 的 pytest fixture。
  • 将 transform() 函数应用到 raw_data 数据集,将结果保存到变量 clean_data 并返回。