Array Dask da dataset Zarr
Ti è stato chiesto di analizzare le temperature europee e ti viene fornito lo stesso insieme di dati che era in era_eu.hdf, ma questa volta in formato Zarr. Zarr è un formato moderno e potente per archiviare dati a blocchi (chunked). È particolarmente adatto ai servizi di cloud computing, ma funziona benissimo anche sul tuo computer.
dask.array è stato importato per te come da.
Questo esercizio fa parte del corso
Programmazione parallela con Dask in Python
Istruzioni dell'esercizio
- Usando la funzione
from_zarr()del sottopacchettodask.array, carica la variabiletempdal datasetdata/era_eu.zarr. - Stampa l'array per vedere le dimensioni dei chunk.
- Trova la temperatura minima su tutti gli assi di tempo e spazio.
- Esegui il calcolo del risultato.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load the temperature data from the Zarr dataset
temps = da.____(____)
# Print the Dask array of temperatures to see the chunk sizes
print(____)
# Find the minimum of the mean monthly temperatures
all_time_low = ____
# Compute the answer
all_time_low_value = ____
print(all_time_low_value, "°C")