Aan de slagGa gratis aan de slag

Dask-arrays uit Zarr-gegevenssets

Je gaat Europese temperaturen analyseren en krijgt dezelfde gegevensset als in era_eu.hdf, maar nu in Zarr-indeling. Zarr is een modern en krachtig gegevenssetformaat voor het opslaan van gechunkte data. Het werkt bijzonder goed in cloudomgevingen, maar is ook prima te gebruiken op je eigen computer.

dask.array is alvast voor je geïmporteerd als da.

Deze oefening maakt deel uit van de cursus

Parallel programmeren met Dask in Python

Cursus bekijken

Oefeninstructies

  • Gebruik de functie from_zarr() uit de subpackage dask.array om de variabele temp te laden uit de gegevensset data/era_eu.zarr.
  • Print de array om de chunkgroottes te zien.
  • Zoek de minimale temperatuur over alle tijd- en ruimte-assen.
  • Bereken het antwoord.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load the temperature data from the Zarr dataset
temps = da.____(____)

# Print the Dask array of temperatures to see the chunk sizes
print(____)

# Find the minimum of the mean monthly temperatures
all_time_low = ____

# Compute the answer
all_time_low_value = ____

print(all_time_low_value, "°C")
Code bewerken en uitvoeren