1. Nauka
  2. /
  3. Kursy
  4. /
  5. Programowanie równoległe z Dask w Pythonie

Connected

ćwiczenie

Tablice Dask z zestawów danych HDF5

Masz za zadanie przeanalizować opady deszczu w Europie z ostatnich 40 lat. Miesięczne średnie opady dla siatki lokalizacji na terenie Europy zostały udostępnione w formacie HDF5. Ponieważ plik jest dość duży, zdecydujesz się wczytać i przetworzyć go za pomocą Dask.

Biblioteka h5py została już zaimportowana, a dask.array – jako da.

Instrukcje

100 XP
  • Otwórz plik 'data/era_eu.hdf5' przy użyciu h5py.
  • Wczytaj zmienną '/precip' do tablicy Dask za pomocą funkcji from_array() i ustaw fragmenty (chunks) o rozmiarze (12 miesięcy, 15 szerokości geograficznych i 15 długości geograficznych).
  • Użyj wycinania tablicy, aby wybrać co 12. indeks wzdłuż pierwszej osi – w ten sposób wybierzesz dane ze stycznia dla wszystkich lat.
  • Oblicz średnią tablicy january_rainfalls wzdłuż osi czasu (oś 0), aby wyznaczyć średnie opady w styczniu na terenie całej Europy.