Arrays de Dask a partir de conjuntos de datos Zarr
Te han encargado analizar temperaturas europeas y te dan el mismo conjunto de datos que estaba en era_eu.hdf, pero esta vez en formato Zarr. Zarr es un formato moderno y potente para almacenar datos en bloques (chunked). Es especialmente adecuado para servicios de computación en la nube, pero también funciona muy bien en tu propio ordenador.
dask.array ya se ha importado como da.
Este ejercicio forma parte del curso
Programación paralela con Dask en Python
Instrucciones del ejercicio
- Usando la función
from_zarr()del subpaquetedask.array, carga la variabletempdel conjunto de datosdata/era_eu.zarr. - Imprime el array para ver los tamaños de los bloques (chunks).
- Encuentra la temperatura mínima a lo largo de todos los ejes de tiempo y espacio.
- Calcula el resultado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load the temperature data from the Zarr dataset
temps = da.____(____)
# Print the Dask array of temperatures to see the chunk sizes
print(____)
# Find the minimum of the mean monthly temperatures
all_time_low = ____
# Compute the answer
all_time_low_value = ____
print(all_time_low_value, "°C")