1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 Python 的 ETL 和 ELT

Connected

道练习

运行一个 ETL 流水线

准备好运行您的第一个 ETL 流水线了吗?我们开始吧!

这里已经为您定义好了 extract()、transform() 和 load() 这三个函数。要运行这条 ETL 数据流水线,您将依次执行这些函数。如果好奇,您可以先看看 extract() 函数的样子。

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

说明

100 XP
  • 使用 extract() 函数从 raw_data.csv 文件中抽取数据。
  • 使用 transform() 函数转换 extracted_data DataFrame。
  • 最后,将 transformed_data DataFrame 加载到 cleaned_data SQL 表中。