SortByKey ve Collect
Çoğu zaman, çift RDD'leri anahtara göre sıralamak faydalıdır (örneğin, bu bölümde ileride göreceğin kelime sayımı gibi). Bu egzersizde, önceki egzersizde oluşturduğun Rdd_Reduced çift RDD'sini azalan düzende sıralayacak ve son çıktıyı yazdıracaksın.
Unutma, çalışma alanında zaten bir SparkContext sc ve Rdd_Reduced mevcut.
Bu egzersiz
PySpark ile Big Data Temelleri
kursunun bir parçasıdırEgzersiz talimatları
Rdd_ReducedRDD'sini anahtara göre azalan düzende sırala.- İçeriği topla ve çıktıyı yazdırmak için üzerinden yinele.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Sort the reduced RDD with the key by descending order
Rdd_Reduced_Sort = Rdd_Reduced.____(ascending=False)
# Iterate over the result and retrieve all the elements of the RDD
for num in Rdd_Reduced_Sort.____():
print("Key {} has {} Counts".format(____, num[1]))