1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în Spark SQL în Python

Connected

exercițiu

Sume cumulative cu funcții de fereastră SQL

O funcție de fereastră funcționează similar cu o funcție de agregare, cu deosebirea că returnează un rezultat pentru fiecare rând din set de date, nu un singur rând per grup.

Poți combina agregarea cu funcțiile de fereastră. O sumă cumulativă calculată cu o funcție de fereastră este mai simplă decât varianta bazată pe joinuri, iar interogarea poate fi și mult mai rapidă.

Îți este pusă la dispoziție o tabelă numită schedule, cu coloanele train_id, station, time și diff_min. Coloana diff_min indică timpul scurs între stația curentă și stația următoare de pe linie.

Instrucțiuni

100 XP
  • Rulează o interogare care adaugă o coloană suplimentară, numită running_total, la înregistrările din acest set de date. Coloana running_total calculează SUM() diferențelor de timp dintre stații, folosind valorile din coloana diff_min.
  • Rulează interogarea și afișează rezultatul.