MulaiMulai sekarang secara gratis

Memuat data penjualan ke file CSV

Memuat data adalah komponen penting dari setiap pipeline data. Hal ini memastikan bahwa konsumen data dan proses apa pun memiliki akses andal ke data yang telah Anda ekstrak dan transformasikan sebelumnya dalam pipeline. Pada latihan ini, Anda akan berlatih memuat data penjualan yang telah ditransformasi ke file CSV menggunakan pandas, yang telah diimpor sebagai pd. Selain itu, data mentah telah diekstrak dan tersedia dalam DataFrame raw_sales_data.

Latihan ini adalah bagian dari kursus

ETL dan ELT di Python

Lihat Kursus

Petunjuk latihan

  • Saring DataFrame raw_sales_data untuk hanya menyisakan semua item dengan harga kurang dari 25 dolar.
  • Perbarui fungsi load() untuk menulis data penjualan yang telah ditransformasi ke file bernama "transformed_sales_data.csv", pastikan untuk tidak menyertakan kolom index.
  • Panggil fungsi load() pada DataFrame yang telah dibersihkan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

def transform(raw_data):
	# Find the items prices less than 25 dollars
	return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]

def load(clean_data):
	# Write the data to a CSV file without the index column
	____.____("transformed_sales_data.csv", index=____)


clean_sales_data = transform(raw_sales_data)

# Call the load function on the cleaned DataFrame
____(____)
Edit dan Jalankan Kode