Valider les transformations de données
Excellent travail jusqu'à présent ! La vérification manuelle des transformations est une première étape importante pour s'assurer que vous maintenez la qualité des données tout au long d'un pipeline. pandas
offre plusieurs fonctions intégrées pour vous aider dans cette tâche.
Pour vous aider à démarrer cet exercice, pandas
a été importé en tant que pd
.
Cet exercice fait partie du cours
ETL et ELT en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def extract(file_path):
# Ingest the data to a DataFrame
raw_data = pd.____(____)
# Return the DataFrame
return raw_data
raw_sales_data = extract("sales_data.parquet")