Memfilter Dask bag
Data politisi yang Anda gunakan berasal dari berbagai sumber, sehingga tidak terlalu bersih. Banyak kamus (dictionary) yang kehilangan key yang mungkin Anda perlukan untuk analisis. Anda perlu menyaring elemen yang tidak memiliki key penting.
Sebuah fungsi bernama has_birth_date() tersedia di lingkungan Anda. Fungsi ini memeriksa kamus masukan untuk melihat apakah berisi key 'birth_date'. Fungsi mengembalikan True jika key ada di dalam kamus dan False jika tidak.
def has_birth_date(dictionary):
return 'birth_date' in dictionary
Bag yang Anda buat pada latihan sebelumnya tersedia di lingkungan Anda sebagai dict_bag.
Latihan ini adalah bagian dari kursus
Pemrograman Paralel dengan Dask di Python
Petunjuk latihan
- Gunakan method
.count()milikdict_baguntuk mencetak jumlah elemen yang dikandungnya. - Gunakan fungsi
has_birth_date()untuk menyaring elemen yang tidak memiliki key'birth_date'. - Cetak jumlah elemen yang dikandung
filtered_bag.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print the number of elements in dict_bag
print(____)
# Filter out records using the has_birth_date() function
filtered_bag = dict_bag.____(____)
# Print the number of elements in filtered_bag
print(____)