LoslegenKostenlos loslegen

Die Zieltabelle

In den vorherigen Übungen hast du einen DataFrame namens recommendations berechnet. Es enthält Paare aus user_id course_id mit einer Bewertung, die die Durchschnittsbewertung dieses Kurses wiedergibt. Die Annahme ist, dass der Kurs mit der besten Bewertung, für den ein Nutzer in Frage kommt, am ehesten zu empfehlen ist.

Es ist nun an der Zeit, diese Tabelle in eine Datenbank zu packen, damit sie von verschiedenen Produkten wie einer Empfehlungsmaschine oder einem E-Mail-System genutzt werden kann.

Da es sich um ein pandas.DataFrame-Objekt handelt, kannst du die Methode .to_sql() nutzen. Natürlich musst du dich erst mal über die Verbindungs-URI mit der Datenbank verbinden. Die Tabelle recommendations ist in deiner Umgebung verfügbar.

Diese Übung ist Teil des Kurses

Einführung in das Data Engineering

Kurs anzeigen

Anleitung zur Übung

  • Gib die Verbindungs-URI für die Postgres-Datenbank auf dem Host localhost mit dem Port 5432 ein. Du kannst dich mit dem Benutzernamen repl und dem Passwort password anmelden. Der Name der Datenbank ist dwh.
  • Vervollständige die Funktion load_to_dwh(). Es sollte in die Tabelle "recommendations" schreiben und die Tabelle ersetzen, falls sie schon existiert.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

connection_uri = "____://____:____@____:____/____"
db_engine = sqlalchemy.create_engine(connection_uri)

def load_to_dwh(recommendations):
    recommendations.____("____", ____, ____="____")
Code bearbeiten und ausführen