Tratamiento de excepciones al cargar datos
A veces, tus canalizaciones de datos pueden lanzar una excepción. Estas excepciones son una forma de alerta, e informan a un Ingeniero de Datos cuando ocurre algo inesperado. Es importante manejar adecuadamente estas excepciones. En este ejercicio, ¡practicaremos precisamente eso!
Para ayudarte a empezar, se ha importado pandas
como pd
, junto con el módulo logging
. El nivel de registro por defecto se ha establecido en "debug"
.
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- Actualiza la canalización para incluir un bloque
try
, e intenta leer los datos de la ruta"sales_data.parquet"
. - Captura un
FileNotFoundError
si no se puede leer el archivo en unpandas
DataFrame. - Crea un registro a nivel de error para documentar el fallo.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def extract(file_path):
return pd.read_parquet(file_path)
# Update the pipeline to include a try block
____:
# Attempt to read in the file
raw_sales_data = extract("____")
# Catch the FileNotFoundError
except ____ as file_not_found:
# Write an error-level log
logging.____(file_not_found)