LoslegenKostenlos loslegen

Eindeutige 5-Tupel in sortierter Reihenfolge

In einer früheren Lektion hast du eine Operation kennengelernt, die Duplikate entfernt und eindeutige Datensätze ermittelt. In einer vorherigen Übung hast du häufige 5-Tupel ermittelt. Wir kombinieren diese beiden Fähigkeiten, um die eindeutigen 5-Tupel zu finden, alphabetisch in absteigender Reihenfolge sortiert.

Die Tabelle text enthält die ersten vier Kapitel des Sherlock-Holmes-Texts. Sie hat die folgenden Spalten: word, id und part.

Diese Übung ist Teil des Kurses

Einführung in Spark SQL mit Python

Kurs anzeigen

Anleitung zur Übung

  • Rufe die letzten zehn eindeutigen 5-Tupel ab, alphabetisch in absteigender Reihenfolge sortiert.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Unique 5-tuples sorted in descending order
query = """
SELECT ____ w1, w2, w3, w4, w5 FROM (
   SELECT word AS w1,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w2,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w3,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w4,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w5
   FROM text
)
ORDER BY w1 DESC, w2 DESC, ____ DESC, w4 ____, ____ ____ 
LIMIT 10
"""
df = spark.sql(query)
df.show()
Code bearbeiten und ausführen