ComeçarComece de graça

5-tuplos exclusivos em ordem ordenada

Em uma aula anterior, você aprendeu uma operação que elimina duplicatas, retornando registros exclusivos. Em um exercício anterior, você obteve 5-tuplos comuns. Vamos combinar essas duas habilidades para encontrar os 5-tuplos exclusivos, ordenados alfabeticamente em ordem descendente.

A tabela text contém os quatro primeiros capítulos do texto de Sherlock Holmes. Ela tem as seguintes colunas: word, id e part.

Este exercício faz parte do curso

Introdução ao Spark SQL em Python

Ver curso

Instruções do exercício

  • Recupere os últimos dez 5-tuplos exclusivos, ordenados alfabeticamente em ordem descendente.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Unique 5-tuples sorted in descending order
query = """
SELECT ____ w1, w2, w3, w4, w5 FROM (
   SELECT word AS w1,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w2,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w3,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w4,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w5
   FROM text
)
ORDER BY w1 DESC, w2 DESC, ____ DESC, w4 ____, ____ ____ 
LIMIT 10
"""
df = spark.sql(query)
df.show()
Editar e executar o código