1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶDaskによる並列プログラミング

Connected

演習

HDF5 データセットからの Dask 配列

あなたは過去40年間のヨーロッパの降雨量を分析する任務を担当しています。ヨーロッパ各地の格子点における月平均降雨量が、HDF5 形式で用意されています。ファイルがかなり大きいため、Dask を使って読み込みと処理を行うことにします。

h5py はすでにインポートされており、dask.array は da としてインポートされています。

指示

100 XP
  • h5py を使って 'data/era_eu.hdf5' ファイルを開きます。
  • from_array() 関数を使って '/precip' 変数を Dask 配列として読み込み、チャンクは(12 か月、緯度 15、経度 15)に設定します。
  • 配列のスライスを使って、最初の軸に沿って 12 個おきのインデックスを選びます。これにより、すべての年の 1 月のデータが選択されます。
  • january_rainfalls の時間軸(軸 0)に沿って平均を取り、ヨーロッパ全体の 1 月の平均降雨量を計算します。