Le tableau cible
Dans les exercices précédents, vous avez calculé un DataFrame appelé recommendations
. Il contient des paires de user_id
's' et course_id
's, avec une note qui représente la note moyenne de ce cours. L'hypothèse est que le cours le mieux noté, qui est éligible pour un utilisateur, serait le mieux à recommander.
Il est temps de placer ce tableau dans une base de données afin qu'il puisse être utilisé par plusieurs produits tels qu'un moteur de recommandation ou un système d'envoi d'e-mails.
Comme il s'agit d'un objet pandas.DataFrame
, vous pouvez utiliser la méthode .to_sql()
. Bien entendu, vous devez d'abord vous connecter à la base de données à l'aide de la connexion URI. Le tableau recommendations
est disponible dans votre environnement.
Cet exercice fait partie du cours
Introduction à l'ingénierie des données
Instructions
- Complétez la connexion URI pour la base de données Postgres sur l'hôte
localhost
avec le port5432
. Vous pouvez vous connecter avec l'utilisateurrepl
et le mot de passepassword
. Le nom de la base de données estdwh
. - Complétez la fonction
load_to_dwh()
. Il doit écrire dans le tableau"recommendations"
et remplacer le tableau s'il existe déjà.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
connection_uri = "____://____:____@____:____/____"
db_engine = sqlalchemy.create_engine(connection_uri)
def load_to_dwh(recommendations):
recommendations.____("____", ____, ____="____")