Memuat data penjualan ke file CSV
Memuat data adalah komponen penting dari setiap pipeline data. Hal ini memastikan bahwa konsumen data dan proses apa pun memiliki akses andal ke data yang telah Anda ekstrak dan transformasikan sebelumnya dalam pipeline. Pada latihan ini, Anda akan berlatih memuat data penjualan yang telah ditransformasi ke file CSV menggunakan pandas, yang telah diimpor sebagai pd. Selain itu, data mentah telah diekstrak dan tersedia dalam DataFrame raw_sales_data.
Latihan ini adalah bagian dari kursus
ETL dan ELT di Python
Petunjuk latihan
- Saring DataFrame
raw_sales_datauntuk hanya menyisakan semua item dengan harga kurang dari 25 dolar. - Perbarui fungsi
load()untuk menulis data penjualan yang telah ditransformasi ke file bernama"transformed_sales_data.csv", pastikan untuk tidak menyertakan kolomindex. - Panggil fungsi
load()pada DataFrame yang telah dibersihkan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def transform(raw_data):
# Find the items prices less than 25 dollars
return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]
def load(clean_data):
# Write the data to a CSV file without the index column
____.____("transformed_sales_data.csv", index=____)
clean_sales_data = transform(raw_sales_data)
# Call the load function on the cleaned DataFrame
____(____)