CommencerCommencer gratuitement

Valider les transformations de données

Excellent travail jusqu'à présent ! La vérification manuelle des transformations est une première étape importante pour s'assurer que vous maintenez la qualité des données tout au long d'un pipeline. pandas offre plusieurs fonctions intégrées pour vous aider dans cette tâche.

Pour vous aider à démarrer cet exercice, pandas a été importé en tant que pd.

Cet exercice fait partie du cours

ETL et ELT en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

def extract(file_path):
  	# Ingest the data to a DataFrame
    raw_data = pd.____(____)
    
    # Return the DataFrame
    return raw_data
  
raw_sales_data = extract("sales_data.parquet")
Modifier et exécuter le code