BaşlayınÜcretsiz Başlayın

Karmaşık Birleştirmeler

Dahili toplulaştırma (aggregation) metodlarına biraz daha aşina olman için, biraz daha karmaşık bir toplulaştırma yapalım! Hedef, tüm bu komutları tek bir satırda birleştirmek.

Unutma, çalışma alanında spark adlı bir SparkSession ve salaries_df adlı Spark DataFrame zaten hazır.

Bu egzersiz

PySpark'e Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • "salary_in_usd" sütununu kullanarak büyük ABD şirketlerinin ortalama maaşlarını hesapla.
  • Büyük ABD şirketlerinin toplam maaşlarını hesapla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____

#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")

# Total salaries in usd
large_companies.groupBy().____.show()
Kodu Düzenle ve Çalıştır