Şirkete göre filtreleme
Son egzersizdekiyle aynı veri kümesini kullanarak, aslında yalnızca Kanada ("CA") için giriş seviyesi ("EN") işlerle ilgilendiğini fark ettin. Oradaki maaşlar nasıl görünüyor?
Unutma, çalışma alanında zaten spark adlı bir SparkSession var!
Bu egzersiz
PySpark'e Giriş
kursunun bir parçasıdırEgzersiz talimatları
- DataFrame'i
company_locationdeğeri"CA"olan satırlarla sınırlamak için filtrele. salary_in_usdsütununun ortalamasını hesapla.- Sonucu göster!
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()