LoslegenKostenlos loslegen

Dask-Arrays aus HDF5-Datensätzen

Du sollst die Niederschläge in Europa der letzten 40 Jahre analysieren. Dir liegt das monatliche Durchschnittsniederschlagsfeld auf einem Gitter über Europa im HDF5-Format vor. Da die Datei ziemlich groß ist, lädst und verarbeitest du sie mit Dask.

h5py wurde bereits für dich importiert und dask.array als da eingebunden.

Diese Übung ist Teil des Kurses

Parallele Programmierung mit Dask in Python

Kurs anzeigen

Anleitung zur Übung

  • Öffne die Datei 'data/era_eu.hdf5' mit h5py.
  • Lade die Variable '/precip' in ein Dask-Array mit der Funktion from_array() und setze Chunks von (12 Monate, 15 Breiten, 15 Längen).
  • Verwende Array-Slicing, um jeden 12. Index entlang der ersten Achse zu wählen – damit bekommst du die Januar-Daten aus allen Jahren.
  • Bilde den Mittelwert von january_rainfalls entlang der Zeitachse (Achse 0), um den mittleren Niederschlag im Januar über Europa zu berechnen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Open the HDF5 dataset using h5py
hdf5_file = ____.____(____)

# Load the file into a Dask array with a reasonable chunk size
precip = da.____(____, chunks=____)

# Select only the months of January
january_rainfalls = ____[____]

# Calculate the mean rainfall in January for each location
january_mean_rainfall = ____.____(axis=____)

plt.imshow(january_mean_rainfall.compute())
plt.show()
Code bearbeiten und ausführen