Gestion des exceptions lors du chargement des données
Il peut arriver que vos pipelines de données génèrent une exception. Ces exceptions constituent une forme d'alerte et permettent à l'ingénieur des données de savoir si quelque chose d'inattendu s'est produit. Il est important de traiter correctement ces exceptions. C'est ce que nous allons faire dans cet exercice !
Pour vous aider à démarrer, pandas
a été importé en tant que pd
, ainsi que le module logging
. Le niveau de journalisation par défaut a été fixé à "debug"
.
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Mettez à jour le pipeline pour inclure un bloc
try
et tentez de lire les données à partir du chemin"sales_data.parquet"
. - Attrape un
FileNotFoundError
si le fichier ne peut pas être lu dans un DataFramepandas
. - Créez un journal de niveau d'erreur pour documenter l'échec.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def extract(file_path):
return pd.read_parquet(file_path)
# Update the pipeline to include a try block
____:
# Attempt to read in the file
raw_sales_data = extract("____")
# Catch the FileNotFoundError
except ____ as file_not_found:
# Write an error-level log
logging.____(file_not_found)