HDF5 veri kümelerinden Dask dizileri
Senden son 40 yıldaki Avrupa yağışlarını analiz etmen isteniyor. Avrupa genelindeki bir konum ızgarasında aylık ortalama yağışlar HDF5 formatında sana sağlandı. Dosya oldukça büyük olduğu için bunu Dask kullanarak yükleyip işlemenin iyi olacağına karar verdin.
h5py senin için içe aktarıldı ve dask.array de da olarak içe aktarıldı.
Bu egzersiz
Python ile Dask ile Paralel Programlama
kursunun bir parçasıdırEgzersiz talimatları
'data/era_eu.hdf5'dosyasınıh5pykullanarak aç.'/precip'değişkeninifrom_array()fonksiyonunu kullanarak bir Dask dizisine yükle ve parçaları (12 ay, 15 enlem ve 15 boylam) olacak şekilde ayarla.- Birinci eksen boyunca her 12. indeksi seçecek şekilde dizi dilimlemesi yap — bu, tüm yıllardan Ocak verilerini seçer.
- Avrupa genelinde Ocak ayındaki ortalama yağışı hesaplamak için
january_rainfallsdizisinin zaman ekseni (eksen0) boyunca ortalamasını al.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Open the HDF5 dataset using h5py
hdf5_file = ____.____(____)
# Load the file into a Dask array with a reasonable chunk size
precip = da.____(____, chunks=____)
# Select only the months of January
january_rainfalls = ____[____]
# Calculate the mean rainfall in January for each location
january_mean_rainfall = ____.____(axis=____)
plt.imshow(january_mean_rainfall.compute())
plt.show()