MulaiMulai sekarang secara gratis

SortByKey dan Collect

Sering kali berguna untuk mengurutkan pair RDD berdasarkan key (misalnya pada word count yang akan Anda lihat nanti di bab ini). Pada latihan ini, Anda akan mengurutkan pair RDD Rdd_Reduced yang Anda buat pada latihan sebelumnya dalam urutan menurun dan mencetak keluaran akhirnya.

Ingat, Anda sudah memiliki SparkContext sc dan Rdd_Reduced yang tersedia di workspace Anda.

Latihan ini adalah bagian dari kursus

Fundamental Big Data dengan PySpark

Lihat Kursus

Petunjuk latihan

  • Urutkan RDD Rdd_Reduced menggunakan key dalam urutan menurun.
  • Kumpulkan isinya dan iterasikan untuk mencetak keluarannya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Sort the reduced RDD with the key by descending order
Rdd_Reduced_Sort = Rdd_Reduced.____(ascending=False)

# Iterate over the result and retrieve all the elements of the RDD
for num in Rdd_Reduced_Sort.____():
  print("Key {} has {} Counts".format(____, num[1]))
Edit dan Jalankan Kode