Şirkete göre filtreleme
Son egzersizdekiyle aynı veri kümesini kullanarak, aslında yalnızca Kanada ("CA") için giriş seviyesi ("EN") işlerle ilgilendiğini fark ettin. Oradaki maaşlar nasıl görünüyor?
Unutma, çalışma alanında zaten spark adlı bir SparkSession var!
Bu egzersiz, kursun bir parçasıdır
PySpark'e Giriş
Egzersiz talimatları
- DataFrame'i
company_locationdeğeri"CA"olan satırlarla sınırlamak için filtrele. salary_in_usdsütununun ortalamasını hesapla.- Sonucu göster!
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()