BaşlayınÜcretsiz Başlayın

PySpark'ta birleştirmeler (aggregations)

Artık kendi birleştirmelerini yapmaya hazırsın! Daha önce kullandığın bir maaş veri kümesini kullanacaksın. Bakalım hangi birleştirmeleri oluşturabileceksin! spark adlı bir SparkSession ve salaries_df adlı Spark DataFrame'i çalışma alanında hazır.

Bu egzersiz

PySpark'e Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • ABD'de, Small bir şirketteki minimum maaşı bul — filtrelemeyi bir SQL dizesi geçmek yerine sütuna doğrudan referans vererek ("salary_in_usd") yap.
  • ABD'de, "L" ile gösterilen Large bir şirketteki maksimum maaşı bul — filtrelemeyi bir SQL dizesi geçmek yerine sütuna doğrudan referans vererek ("salary_in_usd") yap.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Find the minimum salaries for small companies
salaries_df.filter(salaries_df.company_size == "S").groupBy().____.show()

# Find the maximum salaries for large companies
salaries_df.filter(salaries_df.company_size ____).____().max("salary_in_usd").show()
Kodu Düzenle ve Çalıştır