1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do PySpark

Connected

ćwiczenie

Agregacje w PySpark

Czas na własne agregacje! Skorzystasz ze zbioru danych o wynagrodzeniach, którego już używałeś(-aś). Sprawdź, jakie agregacje możesz utworzyć! W przestrzeni roboczej masz już dostępną sesję SparkSession o nazwie spark oraz ramkę danych Spark salaries_df.

Instrukcje

100 XP
  • Znajdź minimalne wynagrodzenie w małej firmie (Small) w USA – filtrując dane przez bezpośrednie odwołanie do kolumny ("salary_in_usd"), a nie przez przekazanie ciągu SQL.
  • Znajdź maksymalne wynagrodzenie w dużej firmie (Large) w USA, oznaczonej jako "L" – filtrując dane przez bezpośrednie odwołanie do kolumny ("salary_in_usd"), a nie przez przekazanie ciągu SQL.