ComenzarEmpieza gratis

5-tuplos únicos en orden ascendente

En una lección anterior viste una operación que elimina duplicados para obtener registros únicos. En un ejercicio anterior obtuviste 5-tuplos comunes. Vamos a combinar estas dos capacidades para encontrar los 5-tuplos únicos, ordenados alfabéticamente en orden descendente.

La tabla text contiene los cuatro primeros capítulos del texto de Sherlock Holmes. Tiene las siguientes columnas: word, id y part.

Este ejercicio forma parte del curso

Introducción a Spark SQL en Python

Ver curso

Instrucciones del ejercicio

  • Recupera los últimos diez 5-tuplos únicos ordenados alfabéticamente en orden descendente.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Unique 5-tuples sorted in descending order
query = """
SELECT ____ w1, w2, w3, w4, w5 FROM (
   SELECT word AS w1,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w2,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w3,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w4,
   ____(word,____) OVER(PARTITION BY ____ ORDER BY ____ ) AS w5
   FROM text
)
ORDER BY w1 DESC, w2 DESC, ____ DESC, w4 ____, ____ ____ 
LIMIT 10
"""
df = spark.sql(query)
df.show()
Editar y ejecutar código