Menyaring berdasarkan perusahaan
Menggunakan himpunan data yang sama dari latihan sebelumnya, Anda menyadari bahwa Anda hanya tertarik pada pekerjaan level pemula ("EN") di Kanada ("CA"). Seperti apa gaji di sana?
Ingat, sudah ada SparkSession bernama spark di ruang kerja Anda!
Latihan ini adalah bagian dari kursus
Pengantar PySpark
Petunjuk latihan
- Gunakan filter untuk menyeleksi baris DataFrame di mana
company_locationadalah"CA". - Hitung nilai rata-rata kolom
salary_in_usd. - Tampilkan hasilnya!
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()