Aan de slagGa gratis aan de slag

Complexe aggregaties

Om je vertrouwd te maken met meer ingebouwde aggregatiemethoden, gaan we een iets complexere aggregatie doen! Het doel is om al deze opdrachten in één regel te combineren.

Onthoud: er staat al een SparkSession spark voor je klaar in je werkruimte, samen met de Spark DataFrame salaries_df.

Deze oefening maakt deel uit van de cursus

Introductie tot PySpark

Cursus bekijken

Oefeninstructies

  • Bereken het gemiddelde salaris van grote Amerikaanse bedrijven met de kolom "salary_in_usd".
  • Bereken het totale salaris van grote Amerikaanse bedrijven.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____

#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")

# Total salaries in usd
large_companies.groupBy().____.show()
Code bewerken en uitvoeren