SortByKey dan Collect
Sering kali berguna untuk mengurutkan pair RDD berdasarkan key (misalnya pada word count yang akan Anda lihat nanti di bab ini). Pada latihan ini, Anda akan mengurutkan pair RDD Rdd_Reduced yang Anda buat pada latihan sebelumnya dalam urutan menurun dan mencetak keluaran akhirnya.
Ingat, Anda sudah memiliki SparkContext sc dan Rdd_Reduced yang tersedia di workspace Anda.
Latihan ini merupakan bagian dari kursus
Fundamental Big Data dengan PySpark
Instruksi latihan
- Urutkan RDD
Rdd_Reducedmenggunakan key dalam urutan menurun. - Kumpulkan isinya dan iterasikan untuk mencetak keluarannya.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Sort the reduced RDD with the key by descending order
Rdd_Reduced_Sort = Rdd_Reduced.____(ascending=False)
# Iterate over the result and retrieve all the elements of the RDD
for num in Rdd_Reduced_Sort.____():
print("Key {} has {} Counts".format(____, num[1]))