1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. ETL và ELT với Python

Connected

Bài tập

Tải dữ liệu bán hàng vào tệp CSV

Tải dữ liệu là một phần thiết yếu của bất kỳ pipeline dữ liệu nào. Việc này đảm bảo mọi bên sử dụng dữ liệu và các quy trình đều có quyền truy cập ổn định vào dữ liệu mà bạn đã trích xuất và chuyển đổi trước đó trong pipeline. Trong bài tập này, bạn sẽ thực hành tải dữ liệu bán hàng đã được chuyển đổi vào một tệp CSV bằng pandas (đã được import là pd). Ngoài ra, dữ liệu thô đã được trích xuất và có sẵn trong DataFrame raw_sales_data.

Hướng dẫn

100 XP
  • Lọc DataFrame raw_sales_data để chỉ giữ các mặt hàng có giá nhỏ hơn 25 đô la.
  • Cập nhật hàm load() để ghi dữ liệu bán hàng đã chuyển đổi vào tệp có tên "transformed_sales_data.csv", đảm bảo không bao gồm cột index.
  • Gọi hàm load() với DataFrame đã được làm sạch.