SortByKey dan Collect
Sering kali berguna untuk mengurutkan pair RDD berdasarkan key (misalnya pada word count yang akan Anda lihat nanti di bab ini). Pada latihan ini, Anda akan mengurutkan pair RDD Rdd_Reduced yang Anda buat pada latihan sebelumnya dalam urutan menurun dan mencetak keluaran akhirnya.
Ingat, Anda sudah memiliki SparkContext sc dan Rdd_Reduced yang tersedia di workspace Anda.
Latihan ini adalah bagian dari kursus
Fundamental Big Data dengan PySpark
Petunjuk latihan
- Urutkan RDD
Rdd_Reducedmenggunakan key dalam urutan menurun. - Kumpulkan isinya dan iterasikan untuk mencetak keluarannya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Sort the reduced RDD with the key by descending order
Rdd_Reduced_Sort = Rdd_Reduced.____(ascending=False)
# Iterate over the result and retrieve all the elements of the RDD
for num in Rdd_Reduced_Sort.____():
print("Key {} has {} Counts".format(____, num[1]))