Karmaşık Birleştirmeler
Dahili toplulaştırma (aggregation) metodlarına biraz daha aşina olman için, biraz daha karmaşık bir toplulaştırma yapalım! Hedef, tüm bu komutları tek bir satırda birleştirmek.
Unutma, çalışma alanında spark adlı bir SparkSession ve salaries_df adlı Spark DataFrame zaten hazır.
Bu egzersiz
PySpark'e Giriş
kursunun bir parçasıdırEgzersiz talimatları
"salary_in_usd"sütununu kullanarak büyük ABD şirketlerinin ortalama maaşlarını hesapla.- Büyük ABD şirketlerinin toplam maaşlarını hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____
#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")
# Total salaries in usd
large_companies.groupBy().____.show()