1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySpark入門

Connected

演習

集計 II

組み込みの集計メソッドにもっと慣れていただくために、flights テーブルを使った演習をさらに用意しました!

SparkSession の spark と、Spark DataFrame の flights はワークスペースにすでに用意されています。

指示

100 XP
  • .avg() メソッドを使って、SEA から出発した Delta Airlines のフライト(carrier 列が "DL" の行)の平均飛行時間を取得し、show() で結果を表示します。出発地は origin 列にあります。
  • .sum() メソッドを使って、air_time 列から duration_hrs という列を作成し、このデータセット内のすべての飛行機が空中にいた総時間(時間単位)を求め、show() で結果を表示します。