1. Learn
  2. /
  3. 课程
  4. /
  5. PySpark 入门

Connected

道练习

将航班与其目的地机场进行连接

您被一家全球旅行公司的数据工程师团队录用。您的第一项任务是通过分析航班数据来改进公司的运营。您的工作区中已有两个数据集:一个包含航班详情(flights),另一个包含目的地机场信息(airports),两者都已就绪可用。

您的目标?将这两个数据集合并,创建一个能将每个航班与其目的地机场关联起来的强大数据集。

说明

100 XP
  • 查看 airports DataFrame。确定可以将 airports 与 flights 表连接的键列。
  • 在 "dest" 列上将 flights 与 airports DataFrame 进行连接。将结果保存为 flights_with_airports。
  • 再次查看 flights_with_airports。留意新增的信息。