1. 学ぶ
  2. /
  3. コース
  4. /
  5. Lập trình song song với Dask trong Python

Connected

演習

Những bài hát phổ biến nhất

Bạn còn một nhiệm vụ nữa với dữ liệu Spotify này: tìm 10 bài hát phổ biến nhất trên tất cả các năm. Thuật toán bạn cần dùng là: tính top 10 bài hát cho từng năm, sau đó gộp các kết quả này lại và tìm top 10 của các top 10.

Hàm sau, dùng để tìm top 10 bài hát trong một DataFrame, đã được cung cấp sẵn trong môi trường của bạn.

def top_10_most_popular(df):
  return df.nlargest(n=10, columns='popularity')

dask và hàm delayed() đã được nhập sẵn. pandas đã được nhập với bí danh pd. Danh sách tên tệp có sẵn trong môi trường dưới tên filenames, và năm của mỗi tệp được lưu trong list years.

指示

100 XP
  • Với mỗi tệp, hãy tìm top 10 bài hát của năm đó bằng hàm top_10_most_popular().
  • Tính toán danh sách các top 10 từ mỗi năm và chọn phần tử đầu tiên của tuple kết quả.
  • Chạy hàm top_10_most_popular() để tìm top 10 bài hát trên DataFrame đã được nối (concatenated).