1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lập trình song song với Dask trong Python

Connected

Bài tập

Xâu chuỗi các thao tác

Giờ bạn đã tải và làm sạch dữ liệu, hãy bắt đầu phân tích. Nhiệm vụ đầu tiên là xem ngày sinh của các chính trị gia. Ngày sinh ở dạng chuỗi như 'YYYY-MM-DD'. 4 ký tự đầu tiên trong chuỗi là năm.

Dask bag đã lọc mà bạn tạo ở bài trước, filtered_bag, đã có sẵn trong môi trường của bạn.

Hướng dẫn

100 XP
  • Dùng phương thức .pluck() của bag để trích xuất các chuỗi 'birth_date'.
  • Viết một hàm lambda để lấy phần năm từ chuỗi 'birth_date' và chuyển nó thành số nguyên.
  • Dùng bag mới birth_year_bag để tính năm sinh nhỏ nhất, lớn nhất và trung bình.
  • Dùng hàm dask.compute() để tính hiệu quả ba giá trị tổng hợp này.