İşlemleri zincirlemek
Veriyi yükleyip temizlediğine göre artık analiz etmeye başlayabilirsin. İlk görevin siyasetçilerin doğum tarihlerine bakmak. Doğum tarihleri 'YYYY-MM-DD' gibi dizge formatında. Dizgedeki ilk 4 karakter yıl bilgisidir.
Önceki egzersizde oluşturduğun filtrelenmiş Dask bag olan filtered_bag çalışma ortamında hazır.
Bu egzersiz
Python ile Dask ile Paralel Programlama
kursunun bir parçasıdırEgzersiz talimatları
- Bag’in
.pluck()metodunu kullanarak'birth_date'dizgelerini çıkar. 'birth_date'dizgelerinden yıl dizgesini alıp tamsayıya çeviren bir lambda fonksiyonu yaz.- Yeni bag
birth_year_bagile minimum, maksimum ve ortalama doğum yıllarını hesapla. - Üç toplamayı verimli şekilde hesaplamak için
dask.compute()fonksiyonunu kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Select the 'birth_date' from each dictionary in the bag
birth_date_bag = filtered_bag.____
# Extract the year as an integer from the birth_date strings
birth_year_bag = birth_date_bag.____(lambda x: ____)
# Calculate the min, max and mean birth years
min_year = ____
max_year = ____
mean_year = ____
# Compute the results efficiently and print them
print(____(____))