Tratamiento de excepciones al cargar datos
A veces, tus canalizaciones de datos pueden lanzar una excepción. Estas excepciones son una forma de alerta, e informan a un Ingeniero de Datos cuando ocurre algo inesperado. Es importante manejar adecuadamente estas excepciones. En este ejercicio, ¡practicaremos precisamente eso!
Para ayudarte a empezar, se ha importado pandas como pd, junto con el módulo logging. El nivel de registro por defecto se ha establecido en "debug".
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- Actualiza la canalización para incluir un bloque
try, e intenta leer los datos de la ruta"sales_data.parquet". - Captura un
FileNotFoundErrorsi no se puede leer el archivo en unpandasDataFrame. - Crea un registro a nivel de error para documentar el fallo.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def extract(file_path):
return pd.read_parquet(file_path)
# Update the pipeline to include a try block
____:
# Attempt to read in the file
raw_sales_data = extract("____")
# Catch the FileNotFoundError
except ____ as file_not_found:
# Write an error-level log
logging.____(file_not_found)