CommencerCommencer gratuitement

Tableaux Dask à partir de jeux de données Zarr

Votre mission est d’analyser les températures en Europe. Vous disposez du même jeu de données que dans era_eu.hdf, mais cette fois au format Zarr. Zarr est un format moderne et puissant pour stocker des données découpées en blocs. Il est particulièrement adapté aux services de cloud computing, mais fonctionne aussi très bien en local.

dask.array a été importé pour vous sous le nom da.

Cet exercice fait partie du cours

Programmation parallèle avec Dask en Python

Afficher le cours

Instructions

  • À l’aide de la fonction from_zarr() du sous-module dask.array, chargez la variable temp depuis le jeu de données data/era_eu.zarr.
  • Affichez le tableau pour voir la taille des blocs.
  • Trouvez la température minimale sur tous les axes de temps et d’espace.
  • Calculez le résultat.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load the temperature data from the Zarr dataset
temps = da.____(____)

# Print the Dask array of temperatures to see the chunk sizes
print(____)

# Find the minimum of the mean monthly temperatures
all_time_low = ____

# Compute the answer
all_time_low_value = ____

print(all_time_low_value, "°C")
Modifier et exécuter le code