LoslegenKostenlos loslegen

Behandlung von Ausnahmen beim Laden von Daten

Manchmal kann es vorkommen, dass deine Datenpipelines eine Ausnahme auslösen. Diese Ausnahmen sind eine Form der Warnung und informieren einen Data Engineer, wenn etwas Unerwartetes passiert ist. Es ist wichtig, dass du mit diesen Ausnahmen richtig umgehst. In dieser Übung werden wir genau das üben!

Um dir den Einstieg zu erleichtern, wurde pandas als pd importiert, und auch das Modul logging wurde importiert. Der Standard-Log-Level ist auf "debug" eingestellt.

Diese Übung ist Teil des Kurses

ETL und ELT in Python

Kurs anzeigen

Anleitung zur Übung

  • Aktualisiere die Pipeline, um einen try Block einzuschließen, und versuche, die Daten aus dem Pfad "sales_data.parquet" zu lesen.
  • Fange eine FileNotFoundError, wenn die Datei nicht in einen pandas DataFrame eingelesen werden kann.
  • Erstelle ein Fehlerprotokoll, um den Fehler zu dokumentieren.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

def extract(file_path):
    return pd.read_parquet(file_path)

# Update the pipeline to include a try block
____:
	# Attempt to read in the file
    raw_sales_data = extract("____")
	
# Catch the FileNotFoundError
except ____ as file_not_found:
	# Write an error-level log
	logging.____(file_not_found)
Code bearbeiten und ausführen