Agregasi Kompleks
Untuk membiasakan Anda dengan lebih banyak metode agregasi bawaan, mari lakukan agregasi yang sedikit lebih kompleks! Tujuannya adalah menggabungkan semua perintah ini dalam satu baris.
Ingat, sebuah SparkSession bernama spark sudah tersedia di ruang kerja Anda, bersama dengan Spark DataFrame salaries_df.
Latihan ini merupakan bagian dari kursus
Pengantar PySpark
Instruksi latihan
- Hitung rata-rata gaji perusahaan besar di AS menggunakan kolom
"salary_in_usd". - Hitung total gaji perusahaan besar di AS.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____
#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")
# Total salaries in usd
large_companies.groupBy().____.show()