MulaiMulai sekarang secara gratis

Merangkaikan operasi

Sekarang setelah Anda memuat dan membersihkan data, Anda dapat mulai menganalisisnya. Tugas pertama Anda adalah melihat tanggal lahir para politisi. Tanggal lahir berbentuk string seperti 'YYYY-MM-DD'. Empat karakter pertama pada string adalah tahun.

Dask bag tersaring yang Anda buat pada latihan sebelumnya, filtered_bag, tersedia di lingkungan Anda.

Latihan ini adalah bagian dari kursus

Pemrograman Paralel dengan Dask di Python

Lihat Kursus

Petunjuk latihan

  • Gunakan metode .pluck() milik bag untuk mengekstrak string 'birth_date'.
  • Tulis fungsi lambda untuk mengambil string tahun dari string 'birth_date' dan mengonversinya menjadi integer.
  • Gunakan bag baru birth_year_bag untuk menghitung tahun kelahiran minimum, maksimum, dan rata-rata.
  • Gunakan fungsi dask.compute() untuk menghitung ketiga agregat tersebut secara efisien.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Select the 'birth_date' from each dictionary in the bag
birth_date_bag = filtered_bag.____

# Extract the year as an integer from the birth_date strings
birth_year_bag = birth_date_bag.____(lambda x: ____)

# Calculate the min, max and mean birth years
min_year = ____
max_year = ____
mean_year = ____

# Compute the results efficiently and print them
print(____(____))
Edit dan Jalankan Kode