IniziaInizia gratis

Aggregazioni complesse

Per prendere confidenza con altri metodi di aggregazione integrati, facciamo un'aggregazione un po' più complessa! L'obiettivo è unire tutti questi comandi in un'unica riga.

Ricorda, una SparkSession chiamata spark è già disponibile nel tuo workspace, insieme allo Spark DataFrame salaries_df.

Questo esercizio fa parte del corso

Introduzione a PySpark

Visualizza il corso

Istruzioni dell'esercizio

  • Calcola lo stipendio medio delle grandi aziende statunitensi usando la colonna "salary_in_usd".
  • Calcola il totale degli stipendi delle grandi aziende statunitensi.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____

#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")

# Total salaries in usd
large_companies.groupBy().____.show()
Modifica ed esegui il codice