Dask bag'lerini filtreleme
Üzerinde çalıştığın politikacı verileri farklı kaynaklardan geliyor, bu yüzden çok da temiz değil. Sözlüklerin çoğunda, analizi çalıştırmak için ihtiyaç duyabileceğin anahtarlar eksik. Önemli anahtarları eksik olan öğeleri filtrelemen gerekecek.
Ortamda has_birth_date() adlı bir fonksiyon mevcut. Bu fonksiyon, verilen sözlükte 'birth_date' anahtarı olup olmadığını kontrol eder. Anahtar sözlükte varsa True, yoksa False döndürür.
def has_birth_date(dictionary):
return 'birth_date' in dictionary
Son egzersizde oluşturduğun bag, ortamında dict_bag olarak mevcut.
Bu egzersiz, kursun bir parçasıdır
Python ile Dask ile Paralel Programlama
Egzersiz talimatları
dict_bag'in.count()metodunu kullanarak içerdiği öğe sayısını yazdır.'birth_date'anahtarı olmayan öğeleri elemek içinhas_birth_date()fonksiyonunu kullan.filtered_bag'in içerdiği öğe sayısını yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Print the number of elements in dict_bag
print(____)
# Filter out records using the has_birth_date() function
filtered_bag = dict_bag.____(____)
# Print the number of elements in filtered_bag
print(____)