Merangkaikan operasi
Sekarang setelah Anda memuat dan membersihkan data, Anda dapat mulai menganalisisnya. Tugas pertama Anda adalah melihat tanggal lahir para politisi. Tanggal lahir berbentuk string seperti 'YYYY-MM-DD'. Empat karakter pertama pada string adalah tahun.
Dask bag tersaring yang Anda buat pada latihan sebelumnya, filtered_bag, tersedia di lingkungan Anda.
Latihan ini adalah bagian dari kursus
Pemrograman Paralel dengan Dask di Python
Petunjuk latihan
- Gunakan metode
.pluck()milik bag untuk mengekstrak string'birth_date'. - Tulis fungsi lambda untuk mengambil string tahun dari string
'birth_date'dan mengonversinya menjadi integer. - Gunakan bag baru
birth_year_baguntuk menghitung tahun kelahiran minimum, maksimum, dan rata-rata. - Gunakan fungsi
dask.compute()untuk menghitung ketiga agregat tersebut secara efisien.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Select the 'birth_date' from each dictionary in the bag
birth_date_bag = filtered_bag.____
# Extract the year as an integer from the birth_date strings
birth_year_bag = birth_date_bag.____(lambda x: ____)
# Calculate the min, max and mean birth years
min_year = ____
max_year = ____
mean_year = ____
# Compute the results efficiently and print them
print(____(____))