Tratamento de exceções ao carregar dados
Às vezes, seus pipelines de dados podem lançar uma exceção. Essas exceções são uma forma de alerta e permitem que o engenheiro de dados saiba quando algo inesperado aconteceu. É importante lidar adequadamente com essas exceções. Neste exercício, vamos praticar exatamente isso!
Para ajudar você a começar, o pandas
foi importado como pd
e o módulo logging
foi importado. O nível de registro padrão foi definido como "debug"
.
Este exercício faz parte do curso
ETL e ELT em Python
Instruções do exercício
- Atualize o pipeline para incluir um bloco
try
e tente ler os dados do caminho"sales_data.parquet"
. - Você receberá um
FileNotFoundError
se o arquivo não puder ser lido em um DataFramepandas
. - Crie um registro de nível de erro para documentar a falha.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def extract(file_path):
return pd.read_parquet(file_path)
# Update the pipeline to include a try block
____:
# Attempt to read in the file
raw_sales_data = extract("____")
# Catch the FileNotFoundError
except ____ as file_not_found:
# Write an error-level log
logging.____(file_not_found)