Construire des fonctions pour extraire des données
Il est important de modulariser le code lors de la construction d'un pipeline de données. Cela permet de rendre les pipelines plus lisibles et réutilisables, et d'accélérer les efforts de dépannage. La création et l'utilisation de fonctions pour des opérations distinctes dans un pipeline peuvent même aider à démarrer un nouveau projet en fournissant un cadre pour commencer le développement.
pandas
a été importé en tant que pd
, et sqlalchemy
est prêt à être utilisé.
Cet exercice fait partie du cours
ETL et ELT en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def extract():
# Create a connection URI and connection engine
connection_uri = "postgresql+psycopg2://repl:password@localhost:____/____"
db_engine = sqlalchemy.____(connection_uri)