1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lập trình song song với Dask trong Python

Connected

Bài tập

Phân tích bài hát trên Spotify

Bạn có một danh sách các tệp CSV muốn gộp lại để khám phá danh mục nhạc của Spotify. Quan trọng là bạn muốn thực hiện việc này thật nhanh và tận dụng toàn bộ sức mạnh tính toán hiện có.

Mỗi tệp CSV chứa tất cả các bài hát phát hành trong một năm nhất định, và mỗi hàng cung cấp thông tin về một bài hát riêng lẻ.

dask và delayed() đã được nhập sẵn, và danh sách tên tệp có sẵn trong môi trường dưới biến filenames. pandas đã được nhập với bí danh pd.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Dùng phiên bản trì hoãn của hàm pd.read_csv() để nạp từng tệp dưới dạng DataFrame.