1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 Python 的 ETL 和 ELT

Connected

道练习

验证加载到 Postgres 数据库的数据

在本练习中,您将最终构建一个端到端的数据管道。该管道会从一个 JSON 文件中抽取学校测试分数,并在转换阶段删除缺失分数的行。此外,还会根据总分对各学校按其所在城市进行排名。最后,转换后的数据集将被保存到 Postgres 数据库中。

为帮助您快速上手,extract() 和 transform() 函数已经构建完毕并按如下方式使用。此外,pandas 已以 pd 的别名导入。祝您顺利!

# Extract and clean the testing scores.
raw_testing_scores = extract("testing_scores.json")
cleaned_testing_scores = transform(raw_testing_scores)

说明 1 / 共 2 个

undefined XP
    1
    2
  • 更新 load() 函数,将 clean_data DataFrame 写入 schools 数据库中的 scores_by_city 表。
  • 如果 scores_by_city 表中已存在数据,请确保用更新后的数据进行替换。