Mulai sekarangMulai gratis

Agregasi Kompleks

Untuk membiasakan Anda dengan lebih banyak metode agregasi bawaan, mari lakukan agregasi yang sedikit lebih kompleks! Tujuannya adalah menggabungkan semua perintah ini dalam satu baris.

Ingat, sebuah SparkSession bernama spark sudah tersedia di ruang kerja Anda, bersama dengan Spark DataFrame salaries_df.

Latihan ini merupakan bagian dari kursus

Pengantar PySpark

Lihat Kursus

Instruksi latihan

  • Hitung rata-rata gaji perusahaan besar di AS menggunakan kolom "salary_in_usd".
  • Hitung total gaji perusahaan besar di AS.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____

#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")

# Total salaries in usd
large_companies.groupBy().____.show()
Edit dan Jalankan Kode