1. 学ぶ
  2. /
  3. コース
  4. /
  5. ETL và ELT với Python

Connected

演習

Chạy một pipeline ETL

Sẵn sàng chạy pipeline ETL đầu tiên của bạn chưa? Bắt đầu thôi!

Ở đây, các hàm extract(), transform(), và load() đã được định nghĩa sẵn. Để chạy pipeline ETL này, bạn sẽ lần lượt thực thi từng hàm. Nếu tò mò, bạn có thể xem qua hàm extract() trông như thế nào.

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

指示

100 XP
  • Dùng hàm extract() để trích xuất dữ liệu từ tệp raw_data.csv.
  • Biến đổi DataFrame extracted_data bằng hàm transform().
  • Cuối cùng, nạp DataFrame transformed_data vào bảng SQL cleaned_data.