ComenzarEmpieza gratis

Arrays de Dask a partir de conjuntos de datos Zarr

Te han encargado analizar temperaturas europeas y te dan el mismo conjunto de datos que estaba en era_eu.hdf, pero esta vez en formato Zarr. Zarr es un formato moderno y potente para almacenar datos en bloques (chunked). Es especialmente adecuado para servicios de computación en la nube, pero también funciona muy bien en tu propio ordenador.

dask.array ya se ha importado como da.

Este ejercicio forma parte del curso

Programación paralela con Dask en Python

Ver curso

Instrucciones del ejercicio

  • Usando la función from_zarr() del subpaquete dask.array, carga la variable temp del conjunto de datos data/era_eu.zarr.
  • Imprime el array para ver los tamaños de los bloques (chunks).
  • Encuentra la temperatura mínima a lo largo de todos los ejes de tiempo y espacio.
  • Calcula el resultado.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load the temperature data from the Zarr dataset
temps = da.____(____)

# Print the Dask array of temperatures to see the chunk sizes
print(____)

# Find the minimum of the mean monthly temperatures
all_time_low = ____

# Compute the answer
all_time_low_value = ____

print(all_time_low_value, "°C")
Editar y ejecutar código