CommencerCommencer gratuitement

Charger dans Postgres

Dans cet exercice, vous allez écrire des données dans un data warehouse PostgreSQL. C’est utile lorsque vous avez le résultat de transformations et que vous souhaitez l’utiliser dans une application.

Par exemple, le résultat d’une transformation peut avoir ajouté une colonne avec des recommandations de films, que vous voulez exploiter dans votre boutique en ligne.

Un DataFrame pandas appelé film_pdf est disponible dans votre espace de travail.

Pour rappel, voici la structure d’un URI de connexion pour sqlalchemy :

postgresql://[user[:password]@][host][:port][/database]

Cet exercice fait partie du cours

Introduction au data engineering

Afficher le cours

Instructions

  • Complétez l’URI de connexion pour créer le moteur de base de données. L’utilisateur et le mot de passe sont respectivement repl et password. L’hôte est localhost, et le port est 5432. Cette fois, la base de données est dwh.
  • Terminez l’appel afin d’utiliser le schéma "store" dans la base. Si la table existe, remplacez-la complètement.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Finish the connection URI
connection_uri = "____://____:____@____:____/____"
db_engine_dwh = sqlalchemy.create_engine(connection_uri)

# Transformation step, join with recommendations data
film_pdf_joined = film_pdf.join(recommendations)

# Finish the .to_sql() call to write to store.film
film_pdf_joined.to_sql("film", ____, schema="____", if_exists="____")

# Run the query to fetch the data
pd.read_sql("SELECT film_id, recommended_film_ids FROM store.film", db_engine_dwh)
Modifier et exécuter le code