1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. ETL và ELT với Python

Connected

Bài tập

Lưu trữ dữ liệu vào tệp

Tải dữ liệu đến điểm đích cuối cùng là một trong những bước quan trọng nhất của pipeline dữ liệu. Trong bài tập này, bạn sẽ dùng hàm transform() dưới đây để biến đổi dữ liệu doanh số sản phẩm trước khi tải nó vào tệp .csv. Điều này giúp những người dùng dữ liệu ở bước sau có góc nhìn tốt hơn về tổng doanh số trên nhiều sản phẩm.

Trong bài này, dữ liệu doanh số đã được tải và biến đổi, và đang được lưu trong DataFrame clean_sales_data. Gói pandas đã được nhập với bí danh pd, và thư viện os cũng đã sẵn sàng để sử dụng!

Hướng dẫn

100 XP
  • Cập nhật hàm load() để ghi dữ liệu đến đường dẫn đã cho, không có header và không có cột index.
  • Kiểm tra để chắc chắn tệp đã được ghi vào đúng đường dẫn mong muốn.
  • Gọi hàm để tải dữ liệu đã biến đổi vào bộ nhớ lưu trữ lâu dài.