MulaiMulai sekarang secara gratis

Menyimpan data ke berkas

Memuat data ke tujuan akhir adalah salah satu langkah terpenting dalam sebuah pipeline data. Pada latihan ini, Anda akan menggunakan fungsi transform() yang ditunjukkan di bawah untuk mentransformasi data penjualan produk sebelum memuatnya ke berkas .csv. Ini akan memberikan pengguna data di hilir pandangan yang lebih baik tentang total penjualan di berbagai produk.

Untuk latihan ini, data penjualan telah dimuat dan ditransformasi, serta disimpan dalam DataFrame clean_sales_data. Paket pandas telah diimpor sebagai pd, dan pustaka os juga siap digunakan!

Latihan ini adalah bagian dari kursus

ETL dan ELT di Python

Lihat Kursus

Petunjuk latihan

  • Perbarui fungsi load() untuk menulis data ke path yang disediakan, tanpa header atau kolom indeks.
  • Periksa untuk memastikan berkas dimuat ke path berkas yang diinginkan.
  • Panggil fungsi tersebut untuk memuat data yang telah ditransformasi ke penyimpanan persisten.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

def load(clean_data, file_path):
    # Write the data to a file
    clean_data.to_csv(file_path, ____, ____)

    # Check to make sure the file exists
    file_exists = os.____.____(____)
    if not file_exists:
        raise Exception(f"File does NOT exists at path {file_path}")

# Load the transformed data to the provided file path
____(clean_sales_data, "transformed_sales_data.csv")
Edit dan Jalankan Kode