IniziaInizia gratis

Array Dask da dataset Zarr

Ti è stato chiesto di analizzare le temperature europee e ti viene fornito lo stesso insieme di dati che era in era_eu.hdf, ma questa volta in formato Zarr. Zarr è un formato moderno e potente per archiviare dati a blocchi (chunked). È particolarmente adatto ai servizi di cloud computing, ma funziona benissimo anche sul tuo computer.

dask.array è stato importato per te come da.

Questo esercizio fa parte del corso

Programmazione parallela con Dask in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Usando la funzione from_zarr() del sottopacchetto dask.array, carica la variabile temp dal dataset data/era_eu.zarr.
  • Stampa l'array per vedere le dimensioni dei chunk.
  • Trova la temperatura minima su tutti gli assi di tempo e spazio.
  • Esegui il calcolo del risultato.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load the temperature data from the Zarr dataset
temps = da.____(____)

# Print the Dask array of temperatures to see the chunk sizes
print(____)

# Find the minimum of the mean monthly temperatures
all_time_low = ____

# Compute the answer
all_time_low_value = ____

print(all_time_low_value, "°C")
Modifica ed esegui il codice