IniziaInizia gratis

Gestire le eccezioni durante il caricamento dei dati

A volte, le tue pipeline di dati possono generare un'eccezione. Queste eccezioni funzionano come avvisi e informano un Data Engineer quando succede qualcosa di inatteso. È importante gestirle correttamente. In questo esercizio, lo metteremo in pratica!

Per aiutarti a iniziare, pandas è stato importato come pd, insieme al modulo logging. Il livello di log predefinito è stato impostato su "debug".

Questo esercizio fa parte del corso

ETL and ELT in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Aggiorna la pipeline per includere un blocco try e prova a leggere i dati dal percorso "sales_data.parquet".
  • Intercetta un FileNotFoundError se il file non può essere letto in un DataFrame pandas.
  • Crea un log di livello errore per documentare l'errore.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

def extract(file_path):
    return pd.read_parquet(file_path)

# Update the pipeline to include a try block
____:
	# Attempt to read in the file
    raw_sales_data = extract("____")
	
# Catch the FileNotFoundError
except ____ as file_not_found:
	# Write an error-level log
	logging.____(file_not_found)
Modifica ed esegui il codice