1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 Python 的 ETL 和 ELT

Connected

道练习

在"检查点"验证数据管道

在本练习中,您将使用一个数据管道:它从 CSV 文件提取税务数据,创建一个新列,根据平均应税收入过滤行,并将数据持久化为 parquet 文件。

已将 pandas 加载为 pd,且已定义好 extract()、transform() 和 load() 函数。您将使用这些函数在管道运行的不同检查点对其进行验证。

说明 1 / 共 3 个

undefined XP
    1
    2
    3
  • 打印 raw_tax_data 和 clean_tax_data 两个 DataFrame 的形状,并观察维度差异。