CommencerCommencer gratuitement

La table cible

Dans les exercices précédents, vous avez calculé un DataFrame appelé recommendations. Il contient des paires de user_id et de course_id, avec une note qui représente la note moyenne de ce cours. L’hypothèse est que le cours le mieux noté, éligible pour un utilisateur, est le meilleur à recommander.

Il est temps d’insérer cette table dans une base de données afin qu’elle puisse être utilisée par plusieurs produits comme un moteur de recommandation ou un système d’e‑mailing.

Comme il s’agit d’un objet pandas.DataFrame, vous pouvez utiliser la méthode .to_sql(). Bien sûr, vous devrez d’abord vous connecter à la base via l’URI de connexion. La table recommendations est disponible dans votre environnement.

Cet exercice fait partie du cours

Introduction au data engineering

Afficher le cours

Instructions

  • Renseignez l’URI de connexion pour la base Postgres sur l’hôte localhost avec le port 5432. Vous pouvez vous connecter avec l’utilisateur repl et le mot de passe password. Le nom de la base est dwh.
  • Complétez la fonction load_to_dwh(). Elle doit écrire dans la table "recommendations" et remplacer la table si elle existe déjà.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

connection_uri = "____://____:____@____:____/____"
db_engine = sqlalchemy.create_engine(connection_uri)

def load_to_dwh(recommendations):
    recommendations.____("____", ____, ____="____")
Modifier et exécuter le code