Aan de slagGa gratis aan de slag

De doeltabel

In de vorige oefeningen heb je een DataFrame berekend genaamd recommendations. Dit bevat paren van user_id's en course_id's, met een rating die de gemiddelde beoordeling van deze cursus weergeeft. De aanname is dat de hoogst beoordeelde cursus die geschikt is voor een gebruiker, het beste is om aan te bevelen.

Het is tijd om deze tabel in een database te zetten, zodat die gebruikt kan worden door verschillende producten zoals een aanbevelingsengine of een e-mailsysteem.

Omdat het een pandas.DataFrame-object is, kun je de methode .to_sql() gebruiken. Natuurlijk moet je eerst met de verbindings-URI met de database verbinden. De tabel recommendations is beschikbaar in je omgeving.

Deze oefening maakt deel uit van de cursus

Introductie tot Data Engineering

Cursus bekijken

Oefeninstructies

  • Vul de verbindings-URI in voor de Postgres-database op host localhost met poort 5432. Je kunt verbinden met gebruiker repl en wachtwoord password. De databasenaam is dwh.
  • Maak de functie load_to_dwh() af. Die moet wegschrijven naar de tabel "recommendations" en de tabel vervangen als die al bestaat.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

connection_uri = "____://____:____@____:____/____"
db_engine = sqlalchemy.create_engine(connection_uri)

def load_to_dwh(recommendations):
    recommendations.____("____", ____, ____="____")
Code bewerken en uitvoeren