1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Foundations of PySpark

Connected

Cvičení

Agregace II

Abys lépe poznal/a další zabudované agregační metody, čeká tě ještě pár cvičení s tabulkou flights!

Nezapomeň, že SparkSession s názvem spark je v tvém pracovním prostoru už připravená, stejně jako Spark DataFrame flights.

Pokyny

100 XP
  • Pomocí metody .avg() zjisti průměrnou dobu letu pro lety společnosti Delta Airlines (kde sloupec carrier má hodnotu "DL"), které odlétaly ze SEA. Místo odletu je uloženo ve sloupci origin. Výsledek zobraz pomocí show().
  • Pomocí metody .sum() spočítej celkový počet hodin, které všechna letadla v tomto datasetu strávila ve vzduchu – vytvoř k tomu sloupec duration_hrs ze sloupce air_time. Výsledek zobraz pomocí show().