Menangani exception saat memuat data
Terkadang, pipeline data Anda dapat memunculkan exception. Exception ini merupakan bentuk peringatan yang memberi tahu Data Engineer ketika terjadi sesuatu yang tidak terduga. Penting untuk menangani exception ini dengan benar. Pada latihan ini, kita akan mempraktikkannya!
Sebagai awal, pandas telah diimpor sebagai pd, dan modul logging juga telah diimpor. Tingkat log bawaan telah disetel ke "debug".
Latihan ini adalah bagian dari kursus
ETL dan ELT di Python
Petunjuk latihan
- Perbarui pipeline untuk menyertakan blok
try, dan coba baca data dari path"sales_data.parquet". - Tangkap
FileNotFoundErrorjika berkas tidak dapat dibaca menjadi DataFramepandas. - Buat log level error untuk mendokumentasikan kegagalan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def extract(file_path):
return pd.read_parquet(file_path)
# Update the pipeline to include a try block
____:
# Attempt to read in the file
raw_sales_data = extract("____")
# Catch the FileNotFoundError
except ____ as file_not_found:
# Write an error-level log
logging.____(file_not_found)