Dask-arrays uit Zarr-gegevenssets
Je gaat Europese temperaturen analyseren en krijgt dezelfde gegevensset als in era_eu.hdf, maar nu in Zarr-indeling. Zarr is een modern en krachtig gegevenssetformaat voor het opslaan van gechunkte data. Het werkt bijzonder goed in cloudomgevingen, maar is ook prima te gebruiken op je eigen computer.
dask.array is alvast voor je geïmporteerd als da.
Deze oefening maakt deel uit van de cursus
Parallel programmeren met Dask in Python
Oefeninstructies
- Gebruik de functie
from_zarr()uit de subpackagedask.arrayom de variabeletempte laden uit de gegevenssetdata/era_eu.zarr. - Print de array om de chunkgroottes te zien.
- Zoek de minimale temperatuur over alle tijd- en ruimte-assen.
- Bereken het antwoord.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the temperature data from the Zarr dataset
temps = da.____(____)
# Print the Dask array of temperatures to see the chunk sizes
print(____)
# Find the minimum of the mean monthly temperatures
all_time_low = ____
# Compute the answer
all_time_low_value = ____
print(all_time_low_value, "°C")