Sıralı benzersiz 5-tuple’lar
Önceki bir derste yinelenenleri kaldırıp benzersiz kayıtları elde eden bir işlemi öğrenmiştin. Önceki bir egzersizde yaygın 5-tuple’ları bulmuştun. Şimdi bu iki yaklaşımı birleştirerek alfabetik olarak azalan düzende sıralanmış benzersiz 5-tuple’ları bulacağız.
text tablosu Sherlock Holmes metninin ilk dört bölümünü içerir. Şu sütunlara sahiptir: word, id ve part.
Bu egzersiz
Python ile Spark SQL'e Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Alfabetik olarak azalan düzende sıralanmış son on benzersiz 5-tuple’ı getir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Unique 5-tuples sorted in descending order
query = """
SELECT ____ w1, w2, w3, w4, w5 FROM (
SELECT word AS w1,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w2,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w3,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w4,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w5
FROM text
)
ORDER BY w1 DESC, w2 DESC, ____ DESC, w4 ____, ____ ____
LIMIT 10
"""
df = spark.sql(query)
df.show()