1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lập trình song song với Dask trong Python

Connected

Bài tập

Mảng Dask từ các tập dữ liệu HDF5

Bạn được giao phân tích lượng mưa ở châu Âu trong 40 năm qua. Lượng mưa trung bình theo tháng trên một lưới các vị trí khắp châu Âu đã được cung cấp cho bạn ở định dạng HDF5. Vì tệp này khá lớn, bạn quyết định tải và xử lý nó bằng Dask.

h5py đã được nhập sẵn cho bạn, và dask.array đã được nhập với bí danh da.

Hướng dẫn

100 XP
  • Mở tệp 'data/era_eu.hdf5' bằng h5py.
  • Tải biến '/precip' vào một mảng Dask bằng hàm from_array(), và đặt các chunk là (12 tháng, 15 vĩ độ, 15 kinh độ).
  • Dùng cắt mảng để chọn mỗi chỉ mục thứ 12 dọc theo trục đầu tiên - thao tác này chọn dữ liệu tháng 1 của tất cả các năm.
  • Lấy trung bình của january_rainfalls theo trục thời gian (trục 0) để tính lượng mưa trung bình vào tháng 1 trên khắp châu Âu.