Behandlung von Ausnahmen beim Laden von Daten
Manchmal kann es vorkommen, dass deine Datenpipelines eine Ausnahme auslösen. Diese Ausnahmen sind eine Form der Warnung und informieren einen Data Engineer, wenn etwas Unerwartetes passiert ist. Es ist wichtig, dass du mit diesen Ausnahmen richtig umgehst. In dieser Übung werden wir genau das üben!
Um dir den Einstieg zu erleichtern, wurde pandas
als pd
importiert, und auch das Modul logging
wurde importiert. Der Standard-Log-Level ist auf "debug"
eingestellt.
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Anleitung zur Übung
- Aktualisiere die Pipeline, um einen
try
Block einzuschließen, und versuche, die Daten aus dem Pfad"sales_data.parquet"
zu lesen. - Fange eine
FileNotFoundError
, wenn die Datei nicht in einenpandas
DataFrame eingelesen werden kann. - Erstelle ein Fehlerprotokoll, um den Fehler zu dokumentieren.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
def extract(file_path):
return pd.read_parquet(file_path)
# Update the pipeline to include a try block
____:
# Attempt to read in the file
raw_sales_data = extract("____")
# Catch the FileNotFoundError
except ____ as file_not_found:
# Write an error-level log
logging.____(file_not_found)