BaşlayınÜcretsiz başlayın

PySpark'ta birleştirmeler (aggregations)

Artık kendi birleştirmelerini yapmaya hazırsın! Daha önce kullandığın bir maaş veri kümesini kullanacaksın. Bakalım hangi birleştirmeleri oluşturabileceksin! spark adlı bir SparkSession ve salaries_df adlı Spark DataFrame'i çalışma alanında hazır.

Bu egzersiz, kursun bir parçasıdır

PySpark'e Giriş

Kursa Göz Atın

Egzersiz talimatları

  • ABD'de, Small bir şirketteki minimum maaşı bul — filtrelemeyi bir SQL dizesi geçmek yerine sütuna doğrudan referans vererek ("salary_in_usd") yap.
  • ABD'de, "L" ile gösterilen Large bir şirketteki maksimum maaşı bul — filtrelemeyi bir SQL dizesi geçmek yerine sütuna doğrudan referans vererek ("salary_in_usd") yap.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Find the minimum salaries for small companies
salaries_df.filter(salaries_df.company_size == "S").groupBy().____.show()

# Find the maximum salaries for large companies
salaries_df.filter(salaries_df.company_size ____).____().max("salary_in_usd").show()
Kodu Düzenle ve Çalıştır