Menyaring berdasarkan perusahaan
Menggunakan himpunan data yang sama dari latihan sebelumnya, Anda menyadari bahwa Anda hanya tertarik pada pekerjaan level pemula ("EN") di Kanada ("CA"). Seperti apa gaji di sana?
Ingat, sudah ada SparkSession bernama spark di ruang kerja Anda!
Latihan ini merupakan bagian dari kursus
Pengantar PySpark
Instruksi latihan
- Gunakan filter untuk menyeleksi baris DataFrame di mana
company_locationadalah"CA". - Hitung nilai rata-rata kolom
salary_in_usd. - Tampilkan hasilnya!
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()