MulaiMulai sekarang secara gratis

Menjalankan Pipeline ETL

Siap menjalankan pipeline ETL pertama Anda? Mari kita mulai!

Di sini, fungsi extract(), transform(), dan load() telah disediakan untuk Anda. Untuk menjalankan pipeline ETL data ini, Anda akan mengeksekusi masing-masing fungsi tersebut. Jika Anda penasaran, lihat sekilas seperti apa fungsi extract() berikut ini.

def extract(file_name):
    print(f"Extracting data from {file_name}")
    return pd.read_csv(file_name)

Latihan ini adalah bagian dari kursus

ETL dan ELT di Python

Lihat Kursus

Petunjuk latihan

  • Gunakan fungsi extract() untuk mengekstrak data dari file raw_data.csv.
  • Transformasikan DataFrame extracted_data menggunakan fungsi transform().
  • Terakhir, muat DataFrame transformed_data ke tabel SQL cleaned_data.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")

# Transform the extracted_data
transformed_data = transform(data_frame=____)

# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")
Edit dan Jalankan Kode