1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do Spark SQL v Pythonu

Connected

cvičení

Agregace krok za krokem

Jestli použít tečkovou notaci nebo SQL, je věcí osobní preference. Jak ale ukazuje videolekce, v některých situacích je SQL jednodušší. A naopak – tečková notace může v určitých případech přinést nečekaný výsledek, například když druhá agregace na sloupci přepíše výsledek té předchozí. Jak bylo zmíněno ve videu, základní syntaxe agg v PySparku umožňuje provést vždy jen jednu agregaci na každý sloupec.

Následující cvičení počítají čas prvního odjezdu pro každou vlakovou linku.

První dva dotazy dávají stejný výsledek. Druhé dva však nikoli. Dokážeš přijít na to, proč?

Pokyny

100 XP
  • Doplň prázdná místa tak, aby první dvojice příkazů zobrazila shodný výsledek.
  • Čtvrtý výsledek s názvem result je pokus o naivní replikaci předchozího řádku. Jeho výsledek je ale překvapivě jiný. Jak? Doplň prázdné místo, které vypíše název druhého sloupce proměnné result.