MulaiMulai sekarang secara gratis

5-tuple unik dalam urutan terurut

Pelajaran sebelumnya membahas operasi untuk menghapus duplikasi, sehingga hanya mengambil rekaman unik. Pada latihan sebelumnya Anda memperoleh 5-tuple yang umum. Kita akan menggabungkan kedua kemampuan ini untuk menemukan 5-tuple unik, diurutkan secara alfabetis menurun.

Tabel text memuat empat bab pertama dari teks Sherlock Holmes. Tabel ini memiliki kolom: word, id, dan part.

Latihan ini adalah bagian dari kursus

Pengantar Spark SQL dalam Python

Lihat Kursus

Petunjuk latihan

  • Ambil sepuluh 5-tuple unik terakhir yang diurutkan secara alfabetis menurun.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Unique 5-tuples sorted in descending order
query = """
SELECT ____ w1, w2, w3, w4, w5 FROM (
   SELECT word AS w1,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w2,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w3,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w4,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w5
   FROM text
)
ORDER BY w1 DESC, w2 DESC, ____ DESC, w4 ____, ____ ____ 
LIMIT 10
"""
df = spark.sql(query)
df.show()
Edit dan Jalankan Kode