CommencerCommencer gratuitement

Chargement dans Postgres

Dans cet exercice, vous allez écrire des données dans un entrepôt de données PostgreSQL. Cela peut être utile lorsque vous avez un résultat de certaines transformations et que vous voulez l'utiliser dans une application.

Par exemple, le résultat d'une transformation pourrait avoir ajouté une colonne avec des recommandations de films, et vous voulez les utiliser dans votre boutique en ligne.

Votre espace de travail contient un DataFrame pandas appelé film_pdf.

Pour rappel, voici la structure d'une connexion URI pour sqlalchemy:

postgresql://[user[:password]@][host][:port][/database]

Cet exercice fait partie du cours

Introduction à l'ingénierie des données

Afficher le cours

Instructions

  • Complétez la connexion URI pour créer le moteur de base de données. L'utilisateur et le mot de passe sont respectivement repl et password. L'hôte est localhost, et le port est 5432. Cette fois, la base de données est dwh.
  • Terminez l'appel afin d'utiliser le schéma "store" dans la base de données. Si le tableau existe, remplacez-le complètement.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Finish the connection URI
connection_uri = "____://____:____@____:____/____"
db_engine_dwh = sqlalchemy.create_engine(connection_uri)

# Transformation step, join with recommendations data
film_pdf_joined = film_pdf.join(recommendations)

# Finish the .to_sql() call to write to store.film
film_pdf_joined.to_sql("film", ____, schema="____", if_exists="____")

# Run the query to fetch the data
pd.read_sql("SELECT film_id, recommended_film_ids FROM store.film", db_engine_dwh)
Modifier et exécuter le code