Gestionar excepciones al cargar datos
A veces, tus canalizaciones de datos pueden lanzar una excepción. Estas excepciones funcionan como alertas y le indican a una persona Data Engineer que ha ocurrido algo inesperado. Es importante gestionarlas correctamente. ¡En este ejercicio, vamos a practicarlo!
Para que puedas empezar, se ha importado pandas como pd, junto con el módulo logging. El nivel de registro predeterminado se ha establecido en "debug".
Este ejercicio forma parte del curso
ETL and ELT con Python
Instrucciones del ejercicio
- Actualiza la canalización para incluir un bloque
trye intenta leer los datos desde la ruta"sales_data.parquet". - Captura un
FileNotFoundErrorsi no se puede leer el archivo en un DataFrame depandas. - Crea un registro de nivel error para documentar el fallo.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def extract(file_path):
return pd.read_parquet(file_path)
# Update the pipeline to include a try block
____:
# Attempt to read in the file
raw_sales_data = extract("____")
# Catch the FileNotFoundError
except ____ as file_not_found:
# Write an error-level log
logging.____(file_not_found)