ComenzarEmpieza gratis

Gestionar excepciones al cargar datos

A veces, tus canalizaciones de datos pueden lanzar una excepción. Estas excepciones funcionan como alertas y le indican a una persona Data Engineer que ha ocurrido algo inesperado. Es importante gestionarlas correctamente. ¡En este ejercicio, vamos a practicarlo!

Para que puedas empezar, se ha importado pandas como pd, junto con el módulo logging. El nivel de registro predeterminado se ha establecido en "debug".

Este ejercicio forma parte del curso

ETL and ELT con Python

Ver curso

Instrucciones del ejercicio

  • Actualiza la canalización para incluir un bloque try e intenta leer los datos desde la ruta "sales_data.parquet".
  • Captura un FileNotFoundError si no se puede leer el archivo en un DataFrame de pandas.
  • Crea un registro de nivel error para documentar el fallo.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

def extract(file_path):
    return pd.read_parquet(file_path)

# Update the pipeline to include a try block
____:
	# Attempt to read in the file
    raw_sales_data = extract("____")
	
# Catch the FileNotFoundError
except ____ as file_not_found:
	# Write an error-level log
	logging.____(file_not_found)
Editar y ejecutar código