1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 Dask로 병렬 프로그래밍

Connected

연습 문제

HDF5 데이터셋에서 Dask 배열 만들기

지난 40년간의 유럽 강수량을 분석하는 임무를 맡았습니다. 유럽 전역의 격자 지점에 대한 월별 평균 강수량이 HDF5 형식으로 제공되었습니다. 파일 크기가 꽤 크기 때문에, Dask를 사용해 불러오고 처리하기로 했습니다.

h5py는 이미 임포트되어 있고, dask.array는 da로 임포트되어 있어요.

지침

100 XP
  • h5py를 사용해 'data/era_eu.hdf5' 파일을 여세요.
  • from_array() 함수를 사용해 '/precip' 변수를 Dask 배열로 불러오고, 청크를 (12개월, 위도 15, 경도 15)로 설정하세요.
  • 첫 번째 축을 따라 12번째마다 인덱스를 선택하도록 배열 슬라이싱을 사용하세요. 이렇게 하면 모든 연도의 1월 데이터가 선택됩니다.
  • 시간 축(축 0)을 따라 january_rainfalls의 평균을 내어, 유럽 전역의 1월 평균 강수량을 계산하세요.