1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ Spark SQL 入門

Connected

Exercises

ウィンドウ関数SQLでのランニングサム

ウィンドウ関数は集約関数に似ていますが、グループごとに1行ではなく、データセットの各行に対して出力を返す点が異なります。

ウィンドウ関数とあわせて集計を行うことができます。ウィンドウ関数を使ったランニングサムは、JOIN を使う場合よりもずっとシンプルに書けます。クエリの実行時間が大幅に短くなることもあります。

train_id、station、time、diff_min の列を持つ schedule というテーブルが用意されています。diff_min 列は、現在の駅から次の駅までの経過時間(分)を表します。

คำแนะนำ

100 XP
  • このデータセットの各レコードに、running_total という追加列を付与するクエリを実行してください。running_total 列は、diff_min 列が示す駅間の時間差を SUM() で累積したものです。
  • クエリを実行し、結果を表示してください。