Créer des fonctions pour extraire des données
Il est important de modulariser le code lors de la création d’un pipeline de données. Cela rend les pipelines plus lisibles et réutilisables, et permet d’accélérer le dépannage. Créer et utiliser des fonctions pour des opérations distinctes dans un pipeline peut même faciliter le démarrage d’un nouveau projet en fournissant un cadre pour commencer le développement.
pandas a été importé sous le nom pd, et sqlalchemy est prêt à être utilisé.
Cet exercice fait partie du cours
ETL et ELT en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def extract():
# Create a connection URI and connection engine
connection_uri = "postgresql+psycopg2://repl:password@localhost:____/____"
db_engine = sqlalchemy.____(connection_uri)