1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySpark入門

Connected

演習

DataFrame を結合する

次の2章では、これまで扱ってきたフライトデータに基づいて、フライトが遅延するかどうかを予測するモデルを作成していきます。このモデルには、ルートを飛んだ機体に関する情報も含めます。最初のステップとして、flights と planes の2つのテーブルを結合しましょう。

指示

100 XP
  • まず、重複した列名を避けるために、planes の year 列名を plane_year に変更します。
  • 次に、tailnum 列をキーとして使用し、flights テーブルと planes を結合して、model_data という新しい DataFrame を作成します。