Menyimpan data ke berkas

Memuat data ke tujuan akhir adalah salah satu langkah terpenting dalam sebuah pipeline data. Pada latihan ini, Anda akan menggunakan fungsi transform() yang ditunjukkan di bawah untuk mentransformasi data penjualan produk sebelum memuatnya ke berkas .csv. Ini akan memberikan pengguna data di hilir pandangan yang lebih baik tentang total penjualan di berbagai produk.

Untuk latihan ini, data penjualan telah dimuat dan ditransformasi, serta disimpan dalam DataFrame clean_sales_data. Paket pandas telah diimpor sebagai pd, dan pustaka os juga siap digunakan!

Latihan ini merupakan bagian dari kursus

ETL dan ELT di Python

Lihat Kursus

Instruksi latihan

Perbarui fungsi load() untuk menulis data ke path yang disediakan, tanpa header atau kolom indeks.
Periksa untuk memastikan berkas dimuat ke path berkas yang diinginkan.
Panggil fungsi tersebut untuk memuat data yang telah ditransformasi ke penyimpanan persisten.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

def load(clean_data, file_path):
    # Write the data to a file
    clean_data.to_csv(file_path, ____, ____)

    # Check to make sure the file exists
    file_exists = os.____.____(____)
    if not file_exists:
        raise Exception(f"File does NOT exists at path {file_path}")

# Load the transformed data to the provided file path
____(clean_sales_data, "transformed_sales_data.csv")

Edit dan Jalankan Kode