IniziaInizia gratis

5‑tuple uniche in ordine ordinato

In una lezione precedente hai visto un’operazione che elimina i duplicati, estraendo i record unici. In un esercizio precedente hai ottenuto le 5‑tuple più comuni. Ora combineremo queste due funzionalità per trovare le 5‑tuple uniche, ordinate alfabeticamente in ordine decrescente.

La tabella text contiene i primi quattro capitoli del testo di Sherlock Holmes. Ha le seguenti colonne: word, id e part.

Questo esercizio fa parte del corso

Introduzione a Spark SQL in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Recupera le ultime dieci 5‑tuple uniche ordinate alfabeticamente in ordine decrescente.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Unique 5-tuples sorted in descending order
query = """
SELECT ____ w1, w2, w3, w4, w5 FROM (
   SELECT word AS w1,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w2,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w3,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w4,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w5
   FROM text
)
ORDER BY w1 DESC, w2 DESC, ____ DESC, w4 ____, ____ ____ 
LIMIT 10
"""
df = spark.sql(query)
df.show()
Modifica ed esegui il codice