Gestire le eccezioni durante il caricamento dei dati
A volte, le tue pipeline di dati possono generare un'eccezione. Queste eccezioni funzionano come avvisi e informano un Data Engineer quando succede qualcosa di inatteso. È importante gestirle correttamente. In questo esercizio, lo metteremo in pratica!
Per aiutarti a iniziare, pandas è stato importato come pd, insieme al modulo logging. Il livello di log predefinito è stato impostato su "debug".
Questo esercizio fa parte del corso
ETL and ELT in Python
Istruzioni dell'esercizio
- Aggiorna la pipeline per includere un blocco
trye prova a leggere i dati dal percorso"sales_data.parquet". - Intercetta un
FileNotFoundErrorse il file non può essere letto in un DataFramepandas. - Crea un log di livello errore per documentare l'errore.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
def extract(file_path):
return pd.read_parquet(file_path)
# Update the pipeline to include a try block
____:
# Attempt to read in the file
raw_sales_data = extract("____")
# Catch the FileNotFoundError
except ____ as file_not_found:
# Write an error-level log
logging.____(file_not_found)