1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lập trình song song với Dask trong Python

Connected

Bài tập

Tạo Dask DataFrame từ các tệp CSV

Trước đây, bạn đã phân tích dữ liệu bài hát Spotify bằng vòng lặp và các hàm delayed. Giờ bạn biết rằng có thể làm điều tương tự dễ dàng hơn với Dask DataFrame. Hãy xem các tác vụ bạn đã làm trước đó trở nên đơn giản thế nào khi dùng các phương thức này thay vì vòng lặp. Tuy nhiên, trước hết, bạn cần nạp tập dữ liệu vào một Dask DataFrame.

Hướng dẫn

100 XP
  • Import gói con dask.dataframe với bí danh dd.
  • Đọc tất cả các tệp CSV trong thư mục data/spotify với kích thước khối tối đa 1MB.
  • Dùng hàm dd.to_datetime() để chuyển các chuỗi trong cột 'release_date' thành datetime.
  • Dùng phương thức .head() của DataFrame để hiển thị 5 hàng đầu của bảng.