AnahtarlaraGöreSayma
Birçok veri kümesi için, anahtar/değer veri kümesindeki anahtarların sayısını bulmak önemlidir. Örneğin, bir ürünün satıldığı ülkelerin sayısını saymak ya da en popüler bebek isimlerini göstermek gibi. Bu basit egzersizde, daha önce oluşturduğun Rdd’yi kullanacak ve bu çift RDD’deki benzersiz anahtarların sayısını hesaplayacaksın.
Unutma, çalışma alanında zaten bir SparkContext sc ve Rdd mevcut.
Bu egzersiz, kursun bir parçasıdır
PySpark ile Big Data Temelleri
Egzersiz talimatları
countByKeyçalıştır ve sonucutotaladlı bir değişkene ata.total’ın tipi nedir?totalüzerinde yineleme yap ve anahtarları ile sayımlarını yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Count the unique keys
total = Rdd.____()
# What is the type of total?
print("The type of total is", ____(total))
# Iterate over the total and print the output
for k, v in total.___():
print("key", ____, "has", ____, "counts")