1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Introduction to Data Engineering

Connected

Bài tập

Từ tác vụ đến các tác vụ nhỏ

Trong bài này, bạn sẽ dùng tính toán song song để áp dụng hàm take_mean_age() nhằm tính tuổi trung bình của vận động viên theo từng năm trong bộ dữ liệu sự kiện Olympic. DataFrame athlete_events đã được nạp sẵn và bao gồm, trong số các cột khác, hai cột sau:

  • Year: năm diễn ra kỳ Olympic
  • Age: tuổi của vận động viên

Bạn sẽ dùng API multiprocessor.Pool để phân bổ khối lượng công việc qua nhiều tiến trình. Hàm parallel_apply() đã được định nghĩa trong mã mẫu. Hàm này nhận vào hàm cần áp dụng, tiêu chí nhóm, và số lõi cần cho phân tích. Lưu ý rằng decorator @print_timing được dùng để đo thời gian cho mỗi thao tác.

Hướng dẫn

100 XP
  • Hoàn thiện mã để bạn áp dụng take_mean_age lần lượt với 1 lõi, sau đó 2 và cuối cùng là 4 lõi.