AnahtarlaraGöreSayma
Birçok veri kümesi için, anahtar/değer veri kümesindeki anahtarların sayısını bulmak önemlidir. Örneğin, bir ürünün satıldığı ülkelerin sayısını saymak ya da en popüler bebek isimlerini göstermek gibi. Bu basit egzersizde, daha önce oluşturduğun Rdd’yi kullanacak ve bu çift RDD’deki benzersiz anahtarların sayısını hesaplayacaksın.
Unutma, çalışma alanında zaten bir SparkContext sc ve Rdd mevcut.
Bu egzersiz
PySpark ile Big Data Temelleri
kursunun bir parçasıdırEgzersiz talimatları
countByKeyçalıştır ve sonucutotaladlı bir değişkene ata.total’ın tipi nedir?totalüzerinde yineleme yap ve anahtarları ile sayımlarını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Count the unique keys
total = Rdd.____()
# What is the type of total?
print("The type of total is", ____(total))
# Iterate over the total and print the output
for k, v in total.___():
print("key", ____, "has", ____, "counts")