1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do Spark SQL v Pythonu

Connected

cvičení

Průběžné součty pomocí okenní funkce v SQL

Okenní funkce funguje podobně jako agregační funkce – s tím rozdílem, že vrací výsledek pro každý řádek v datové sadě, nikoli jediný řádek za skupinu.

Aggregaci lze kombinovat s okenními funkcemi. Průběžný součet pomocí okenní funkce je jednodušší než řešení přes joiny a dotaz může být také výrazně rychlejší.

K dispozici máš tabulku schedule se sloupci train_id, station, time a diff_min. Sloupec diff_min udává uplynulý čas mezi aktuální stanicí a následující stanicí na lince.

Pokyny

100 XP
  • Spusť dotaz, který k záznamům v této datové sadě přidá nový sloupec running_total. Sloupec running_total vypočítá SUM() rozdílů mezi časy stanic ze sloupce diff_min.
  • Spusť dotaz a zobraz výsledek.