La table cible
Dans les exercices précédents, vous avez calculé un DataFrame appelé recommendations. Il contient des paires de user_id et de course_id, avec une note qui représente la note moyenne de ce cours. L’hypothèse est que le cours le mieux noté, éligible pour un utilisateur, est le meilleur à recommander.
Il est temps d’insérer cette table dans une base de données afin qu’elle puisse être utilisée par plusieurs produits comme un moteur de recommandation ou un système d’e‑mailing.
Comme il s’agit d’un objet pandas.DataFrame, vous pouvez utiliser la méthode .to_sql(). Bien sûr, vous devrez d’abord vous connecter à la base via l’URI de connexion. La table recommendations est disponible dans votre environnement.
Cet exercice fait partie du cours
Introduction au data engineering
Instructions
- Renseignez l’URI de connexion pour la base Postgres sur l’hôte
localhostavec le port5432. Vous pouvez vous connecter avec l’utilisateurreplet le mot de passepassword. Le nom de la base estdwh. - Complétez la fonction
load_to_dwh(). Elle doit écrire dans la table"recommendations"et remplacer la table si elle existe déjà.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
connection_uri = "____://____:____@____:____/____"
db_engine = sqlalchemy.create_engine(connection_uri)
def load_to_dwh(recommendations):
recommendations.____("____", ____, ____="____")