5-tuplos únicos en orden ascendente
En una lección anterior viste una operación que elimina duplicados para obtener registros únicos. En un ejercicio anterior obtuviste 5-tuplos comunes. Vamos a combinar estas dos capacidades para encontrar los 5-tuplos únicos, ordenados alfabéticamente en orden descendente.
La tabla text contiene los cuatro primeros capítulos del texto de Sherlock Holmes. Tiene las siguientes columnas: word, id y part.
Este ejercicio forma parte del curso
Introducción a Spark SQL en Python
Instrucciones del ejercicio
- Recupera los últimos diez 5-tuplos únicos ordenados alfabéticamente en orden descendente.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Unique 5-tuples sorted in descending order
query = """
SELECT ____ w1, w2, w3, w4, w5 FROM (
SELECT word AS w1,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w2,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w3,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w4,
____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w5
FROM text
)
ORDER BY w1 DESC, w2 DESC, ____ DESC, w4 ____, ____ ____
LIMIT 10
"""
df = spark.sql(query)
df.show()