MulaiMulai sekarang secara gratis

Agregasi Kompleks

Untuk membiasakan Anda dengan lebih banyak metode agregasi bawaan, mari lakukan agregasi yang sedikit lebih kompleks! Tujuannya adalah menggabungkan semua perintah ini dalam satu baris.

Ingat, sebuah SparkSession bernama spark sudah tersedia di ruang kerja Anda, bersama dengan Spark DataFrame salaries_df.

Latihan ini adalah bagian dari kursus

Pengantar PySpark

Lihat Kursus

Petunjuk latihan

  • Hitung rata-rata gaji perusahaan besar di AS menggunakan kolom "salary_in_usd".
  • Hitung total gaji perusahaan besar di AS.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____

#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")

# Total salaries in usd
large_companies.groupBy().____.show()
Edit dan Jalankan Kode