BaşlayınÜcretsiz Başlayın

SortByKey ve Collect

Çoğu zaman, çift RDD'leri anahtara göre sıralamak faydalıdır (örneğin, bu bölümde ileride göreceğin kelime sayımı gibi). Bu egzersizde, önceki egzersizde oluşturduğun Rdd_Reduced çift RDD'sini azalan düzende sıralayacak ve son çıktıyı yazdıracaksın.

Unutma, çalışma alanında zaten bir SparkContext sc ve Rdd_Reduced mevcut.

Bu egzersiz

PySpark ile Big Data Temelleri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Rdd_Reduced RDD'sini anahtara göre azalan düzende sırala.
  • İçeriği topla ve çıktıyı yazdırmak için üzerinden yinele.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Sort the reduced RDD with the key by descending order
Rdd_Reduced_Sort = Rdd_Reduced.____(ascending=False)

# Iterate over the result and retrieve all the elements of the RDD
for num in Rdd_Reduced_Sort.____():
  print("Key {} has {} Counts".format(____, num[1]))
Kodu Düzenle ve Çalıştır