Aan de slagBegin gratis

Dask-arrays uit Zarr-gegevenssets

Je gaat Europese temperaturen analyseren en krijgt dezelfde gegevensset als in era_eu.hdf, maar nu in Zarr-indeling. Zarr is een modern en krachtig gegevenssetformaat voor het opslaan van gechunkte data. Het werkt bijzonder goed in cloudomgevingen, maar is ook prima te gebruiken op je eigen computer.

dask.array is alvast voor je geïmporteerd als da.

Deze oefening maakt deel uit van de cursus

Parallel programmeren met Dask in Python

Bekijk cursus

Oefeninstructies

  • Gebruik de functie from_zarr() uit de subpackage dask.array om de variabele temp te laden uit de gegevensset data/era_eu.zarr.
  • Print de array om de chunkgroottes te zien.
  • Zoek de minimale temperatuur over alle tijd- en ruimte-assen.
  • Bereken het antwoord.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Load the temperature data from the Zarr dataset
temps = da.____(____)

# Print the Dask array of temperatures to see the chunk sizes
print(____)

# Find the minimum of the mean monthly temperatures
all_time_low = ____

# Compute the answer
all_time_low_value = ____

print(all_time_low_value, "°C")
Code bewerken en uitvoeren