SortByKey y Collect
Muchas veces es útil ordenar el par RDD en función de la clave (por ejemplo, en el recuento de palabras que verás más adelante en este capítulo). En este ejercicio ordenarás en orden descendente el par RDD Rdd_Reduced
que creaste en el ejercicio anterior e imprimirás la salida final.
Recuerda que ya tienes sc
y Rdd_Reduced
de SparkContext disponibles en tu espacio de trabajo.
Este ejercicio forma parte del curso
Fundamentos de big data con PySpark
Instrucciones de ejercicio
- Ordena el RDD
Rdd_Reduced
en orden descendente utilizando la clave. - Obtén el contenido e itera para imprimir la salida.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Sort the reduced RDD with the key by descending order
Rdd_Reduced_Sort = Rdd_Reduced.____(ascending=False)
# Iterate over the result and retrieve all the elements of the RDD
for num in Rdd_Reduced_Sort.____():
print("Key {} has {} Counts".format(____, num[1]))