CommencerCommencer gratuitement

Gestion des exceptions lors du chargement des données

Il peut arriver que vos pipelines de données génèrent une exception. Ces exceptions constituent une forme d'alerte et permettent à l'ingénieur des données de savoir si quelque chose d'inattendu s'est produit. Il est important de traiter correctement ces exceptions. C'est ce que nous allons faire dans cet exercice !

Pour vous aider à démarrer, pandas a été importé en tant que pd, ainsi que le module logging. Le niveau de journalisation par défaut a été fixé à "debug".

Cet exercice fait partie du cours

ETL et ELT en Python

Afficher le cours

Instructions

  • Mettez à jour le pipeline pour inclure un bloc try et tentez de lire les données à partir du chemin "sales_data.parquet".
  • Attrape un FileNotFoundError si le fichier ne peut pas être lu dans un DataFrame pandas.
  • Créez un journal de niveau d'erreur pour documenter l'échec.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

def extract(file_path):
    return pd.read_parquet(file_path)

# Update the pipeline to include a try block
____:
	# Attempt to read in the file
    raw_sales_data = extract("____")
	
# Catch the FileNotFoundError
except ____ as file_not_found:
	# Write an error-level log
	logging.____(file_not_found)
Modifier et exécuter le code