Menjalankan Pipeline ETL
Siap menjalankan pipeline ETL pertama Anda? Mari kita mulai!
Di sini, fungsi extract(), transform(), dan load() telah disediakan untuk Anda. Untuk menjalankan pipeline ETL data ini, Anda akan mengeksekusi masing-masing fungsi tersebut. Jika Anda penasaran, lihat sekilas seperti apa fungsi extract() berikut ini.
def extract(file_name):
print(f"Extracting data from {file_name}")
return pd.read_csv(file_name)
Latihan ini adalah bagian dari kursus
ETL dan ELT di Python
Petunjuk latihan
- Gunakan fungsi
extract()untuk mengekstrak data dari fileraw_data.csv. - Transformasikan DataFrame
extracted_datamenggunakan fungsitransform(). - Terakhir, muat DataFrame
transformed_datake tabel SQLcleaned_data.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")
# Transform the extracted_data
transformed_data = transform(data_frame=____)
# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")