Agregasi Kompleks
Untuk membiasakan Anda dengan lebih banyak metode agregasi bawaan, mari lakukan agregasi yang sedikit lebih kompleks! Tujuannya adalah menggabungkan semua perintah ini dalam satu baris.
Ingat, sebuah SparkSession bernama spark sudah tersedia di ruang kerja Anda, bersama dengan Spark DataFrame salaries_df.
Latihan ini adalah bagian dari kursus
Pengantar PySpark
Petunjuk latihan
- Hitung rata-rata gaji perusahaan besar di AS menggunakan kolom
"salary_in_usd". - Hitung total gaji perusahaan besar di AS.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____
#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")
# Total salaries in usd
large_companies.groupBy().____.show()