Dask-Arrays aus HDF5-Datensätzen
Du sollst die Niederschläge in Europa der letzten 40 Jahre analysieren. Dir liegt das monatliche Durchschnittsniederschlagsfeld auf einem Gitter über Europa im HDF5-Format vor. Da die Datei ziemlich groß ist, lädst und verarbeitest du sie mit Dask.
h5py wurde bereits für dich importiert und dask.array als da eingebunden.
Diese Übung ist Teil des Kurses
Parallele Programmierung mit Dask in Python
Anleitung zur Übung
- Öffne die Datei
'data/era_eu.hdf5'mith5py. - Lade die Variable
'/precip'in ein Dask-Array mit der Funktionfrom_array()und setze Chunks von (12 Monate, 15 Breiten, 15 Längen). - Verwende Array-Slicing, um jeden 12. Index entlang der ersten Achse zu wählen – damit bekommst du die Januar-Daten aus allen Jahren.
- Bilde den Mittelwert von
january_rainfallsentlang der Zeitachse (Achse0), um den mittleren Niederschlag im Januar über Europa zu berechnen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Open the HDF5 dataset using h5py
hdf5_file = ____.____(____)
# Load the file into a Dask array with a reasonable chunk size
precip = da.____(____, chunks=____)
# Select only the months of January
january_rainfalls = ____[____]
# Calculate the mean rainfall in January for each location
january_mean_rainfall = ____.____(axis=____)
plt.imshow(january_mean_rainfall.compute())
plt.show()