Die Zieltabelle
In den vorherigen Übungen hast du einen DataFrame namens recommendations
berechnet. Es enthält Paare aus user_id
course_id
mit einer Bewertung, die die Durchschnittsbewertung dieses Kurses wiedergibt. Die Annahme ist, dass der Kurs mit der besten Bewertung, für den ein Nutzer in Frage kommt, am ehesten zu empfehlen ist.
Es ist nun an der Zeit, diese Tabelle in eine Datenbank zu packen, damit sie von verschiedenen Produkten wie einer Empfehlungsmaschine oder einem E-Mail-System genutzt werden kann.
Da es sich um ein pandas.DataFrame
-Objekt handelt, kannst du die Methode .to_sql()
nutzen. Natürlich musst du dich erst mal über die Verbindungs-URI mit der Datenbank verbinden. Die Tabelle recommendations
ist in deiner Umgebung verfügbar.
Diese Übung ist Teil des Kurses
Einführung in das Data Engineering
Anleitung zur Übung
- Gib die Verbindungs-URI für die Postgres-Datenbank auf dem Host
localhost
mit dem Port5432
ein. Du kannst dich mit dem Benutzernamenrepl
und dem Passwortpassword
anmelden. Der Name der Datenbank istdwh
. - Vervollständige die Funktion
load_to_dwh()
. Es sollte in die Tabelle"recommendations"
schreiben und die Tabelle ersetzen, falls sie schon existiert.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
connection_uri = "____://____:____@____:____/____"
db_engine = sqlalchemy.create_engine(connection_uri)
def load_to_dwh(recommendations):
recommendations.____("____", ____, ____="____")