Menangani exception saat memuat data
Terkadang, pipeline data Anda dapat memunculkan exception. Exception ini merupakan bentuk peringatan yang memberi tahu Data Engineer ketika terjadi sesuatu yang tidak terduga. Penting untuk menangani exception ini dengan benar. Pada latihan ini, kita akan mempraktikkannya!
Sebagai awal, pandas telah diimpor sebagai pd, dan modul logging juga telah diimpor. Tingkat log bawaan telah disetel ke "debug".
Latihan ini merupakan bagian dari kursus
ETL dan ELT di Python
Instruksi latihan
- Perbarui pipeline untuk menyertakan blok
try, dan coba baca data dari path"sales_data.parquet". - Tangkap
FileNotFoundErrorjika berkas tidak dapat dibaca menjadi DataFramepandas. - Buat log level error untuk mendokumentasikan kegagalan.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
def extract(file_path):
return pd.read_parquet(file_path)
# Update the pipeline to include a try block
____:
# Attempt to read in the file
raw_sales_data = extract("____")
# Catch the FileNotFoundError
except ____ as file_not_found:
# Write an error-level log
logging.____(file_not_found)