1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lập trình song song với Dask trong Python

Connected

Bài tập

Tạo một bag từ văn bản đã lưu

Lần này, đồng nghiệp đã lưu các bài đánh giá vào một số tệp văn bản. Có nhiều tệp và mỗi tệp chứa nhiều bài đánh giá. Mỗi bài đánh giá nằm trên một dòng riêng trong tệp văn bản.

Bạn muốn tải chúng vào Dask theo kiểu lười (lazily) để có thể dùng xử lý song song và phân tích nhanh hơn.

dask.bag đã được nhập sẵn với tên db.

Hướng dẫn

100 XP
  • Dùng hàm read_text() để tải tất cả các tệp .txt trong thư mục data/tripadvisor_hotel_reviews.
  • Đếm số lượng bài đánh giá trong bag.
  • Dùng phương thức .compute() của bag để in kết quả.