5‑tuple uniche in ordine ordinato
In una lezione precedente hai visto un’operazione che elimina i duplicati, estraendo i record unici. In un esercizio precedente hai ottenuto le 5‑tuple più comuni. Ora combineremo queste due funzionalità per trovare le 5‑tuple uniche, ordinate alfabeticamente in ordine decrescente.
La tabella text contiene i primi quattro capitoli del testo di Sherlock Holmes. Ha le seguenti colonne: word, id e part.
Questo esercizio fa parte del corso
Introduzione a Spark SQL in Python
Istruzioni dell'esercizio
- Recupera le ultime dieci 5‑tuple uniche ordinate alfabeticamente in ordine decrescente.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Unique 5-tuples sorted in descending order
query = """
SELECT ____ w1, w2, w3, w4, w5 FROM (
SELECT word AS w1,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w2,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w3,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w4,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w5
FROM text
)
ORDER BY w1 DESC, w2 DESC, ____ DESC, w4 ____, ____ ____
LIMIT 10
"""
df = spark.sql(query)
df.show()