Karmaşık Birleştirmeler
Dahili toplulaştırma (aggregation) metodlarına biraz daha aşina olman için, biraz daha karmaşık bir toplulaştırma yapalım! Hedef, tüm bu komutları tek bir satırda birleştirmek.
Unutma, çalışma alanında spark adlı bir SparkSession ve salaries_df adlı Spark DataFrame zaten hazır.
Bu egzersiz, kursun bir parçasıdır
PySpark'e Giriş
Egzersiz talimatları
"salary_in_usd"sütununu kullanarak büyük ABD şirketlerinin ortalama maaşlarını hesapla.- Büyük ABD şirketlerinin toplam maaşlarını hesapla.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____
#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")
# Total salaries in usd
large_companies.groupBy().____.show()