Menjalankan Pipeline ETL
Siap menjalankan pipeline ETL pertama Anda? Mari kita mulai!
Di sini, fungsi extract(), transform(), dan load() telah disediakan untuk Anda. Untuk menjalankan pipeline ETL data ini, Anda akan mengeksekusi masing-masing fungsi tersebut. Jika Anda penasaran, lihat sekilas seperti apa fungsi extract() berikut ini.
def extract(file_name):
print(f"Extracting data from {file_name}")
return pd.read_csv(file_name)
Latihan ini merupakan bagian dari kursus
ETL dan ELT di Python
Instruksi latihan
- Gunakan fungsi
extract()untuk mengekstrak data dari fileraw_data.csv. - Transformasikan DataFrame
extracted_datamenggunakan fungsitransform(). - Terakhir, muat DataFrame
transformed_datake tabel SQLcleaned_data.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Extract data from the raw_data.csv file
extracted_data = ____(file_name="raw_data.csv")
# Transform the extracted_data
transformed_data = transform(data_frame=____)
# Load the transformed_data to cleaned_data.csv
____(data_frame=transformed_data, target_table="cleaned_data")