BaşlayınÜcretsiz Başlayın

AnahtarlaraGöreSayma

Birçok veri kümesi için, anahtar/değer veri kümesindeki anahtarların sayısını bulmak önemlidir. Örneğin, bir ürünün satıldığı ülkelerin sayısını saymak ya da en popüler bebek isimlerini göstermek gibi. Bu basit egzersizde, daha önce oluşturduğun Rdd’yi kullanacak ve bu çift RDD’deki benzersiz anahtarların sayısını hesaplayacaksın.

Unutma, çalışma alanında zaten bir SparkContext sc ve Rdd mevcut.

Bu egzersiz

PySpark ile Big Data Temelleri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • countByKey çalıştır ve sonucu total adlı bir değişkene ata.
  • total’ın tipi nedir?
  • total üzerinde yineleme yap ve anahtarları ile sayımlarını yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Count the unique keys
total = Rdd.____()

# What is the type of total?
print("The type of total is", ____(total))

# Iterate over the total and print the output
for k, v in total.___(): 
  print("key", ____, "has", ____, "counts")
Kodu Düzenle ve Çalıştır