CommencerCommencer gratuitement

5-uplets uniques en ordre trié

Une leçon précédente a présenté une opération qui élimine les doublons pour ne garder que les enregistrements uniques. Dans un exercice précédent, vous avez obtenu des 5-uplets fréquents. Nous allons combiner ces deux fonctionnalités pour trouver les 5-uplets uniques, triés alphabétiquement par ordre décroissant.

La table text contient les quatre premiers chapitres du texte de Sherlock Holmes. Elle possède les colonnes suivantes : word, id et part.

Cet exercice fait partie du cours

Introduction à Spark SQL en Python

Afficher le cours

Instructions

  • Récupérez les dix derniers 5-uplets uniques, triés alphabétiquement par ordre décroissant.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Unique 5-tuples sorted in descending order
query = """
SELECT ____ w1, w2, w3, w4, w5 FROM (
   SELECT word AS w1,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w2,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w3,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w4,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w5
   FROM text
)
ORDER BY w1 DESC, w2 DESC, ____ DESC, w4 ____, ____ ____ 
LIMIT 10
"""
df = spark.sql(query)
df.show()
Modifier et exécuter le code