1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySpark入門

Connected

演習

フライトと目的地の空港を結合する

あなたはグローバルな旅行会社のデータエンジニアとして採用されました。最初のタスクは、フライトデータを分析して業務改善に役立てることです。ワークスペースには2つのデータセットがあり、1つはフライトの詳細(flights)、もう1つは目的地の空港情報(airports)で、どちらもすでに利用可能です。

目標は、各フライトをその目的地の空港に結び付ける、使い勝手の良いデータセットを作成することです。

指示

100 XP
  • airports DataFrame を確認し、airports を flights テーブルと結合するためのキー列がどれかを把握します。
  • "dest" 列で flights と airports DataFrame を結合し、結果を flights_with_airports として保存します。
  • flights_with_airports を再度確認し、追加された新しい情報に注目します。