PySpark'ta birleştirmeler (aggregations)
Artık kendi birleştirmelerini yapmaya hazırsın!
Daha önce kullandığın bir maaş veri kümesini kullanacaksın. Bakalım hangi birleştirmeleri oluşturabileceksin!
spark adlı bir SparkSession ve salaries_df adlı Spark DataFrame'i çalışma alanında hazır.
Bu egzersiz
PySpark'e Giriş
kursunun bir parçasıdırEgzersiz talimatları
- ABD'de, Small bir şirketteki minimum maaşı bul — filtrelemeyi bir SQL dizesi geçmek yerine sütuna doğrudan referans vererek (
"salary_in_usd") yap. - ABD'de,
"L"ile gösterilen Large bir şirketteki maksimum maaşı bul — filtrelemeyi bir SQL dizesi geçmek yerine sütuna doğrudan referans vererek ("salary_in_usd") yap.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Find the minimum salaries for small companies
salaries_df.filter(salaries_df.company_size == "S").groupBy().____.show()
# Find the maximum salaries for large companies
salaries_df.filter(salaries_df.company_size ____).____().max("salary_in_usd").show()