Menyimpan data ke berkas
Memuat data ke tujuan akhir adalah salah satu langkah terpenting dalam sebuah pipeline data. Pada latihan ini, Anda akan menggunakan fungsi transform() yang ditunjukkan di bawah untuk mentransformasi data penjualan produk sebelum memuatnya ke berkas .csv. Ini akan memberikan pengguna data di hilir pandangan yang lebih baik tentang total penjualan di berbagai produk.
Untuk latihan ini, data penjualan telah dimuat dan ditransformasi, serta disimpan dalam DataFrame clean_sales_data. Paket pandas telah diimpor sebagai pd, dan pustaka os juga siap digunakan!
Latihan ini merupakan bagian dari kursus
ETL dan ELT di Python
Instruksi latihan
- Perbarui fungsi
load()untuk menulis data ke path yang disediakan, tanpa header atau kolom indeks. - Periksa untuk memastikan berkas dimuat ke path berkas yang diinginkan.
- Panggil fungsi tersebut untuk memuat data yang telah ditransformasi ke penyimpanan persisten.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
def load(clean_data, file_path):
# Write the data to a file
clean_data.to_csv(file_path, ____, ____)
# Check to make sure the file exists
file_exists = os.____.____(____)
if not file_exists:
raise Exception(f"File does NOT exists at path {file_path}")
# Load the transformed data to the provided file path
____(clean_sales_data, "transformed_sales_data.csv")