Aggregazioni complesse
Per prendere confidenza con altri metodi di aggregazione integrati, facciamo un'aggregazione un po' più complessa! L'obiettivo è unire tutti questi comandi in un'unica riga.
Ricorda, una SparkSession chiamata spark è già disponibile nel tuo workspace, insieme allo Spark DataFrame salaries_df.
Questo esercizio fa parte del corso
Introduzione a PySpark
Istruzioni dell'esercizio
- Calcola lo stipendio medio delle grandi aziende statunitensi usando la colonna
"salary_in_usd". - Calcola il totale degli stipendi delle grandi aziende statunitensi.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____
#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")
# Total salaries in usd
large_companies.groupBy().____.show()