Aan de slagGa gratis aan de slag

Joinen op relaties

Je hebt in de vorige oefening het volgende diagram gebruikt:

Database Schema for Customer and Order

Je hebt geleerd dat je de functie read_sql() van pandas kunt gebruiken om de database te bevragen. De echte kracht van SQL is dat je snel informatie uit meerdere tabellen kunt combineren. Dat doe je met de JOIN-instructie.

Wanneer je twee of meer tabellen joinet, zet pandas alle kolommen van het queryresultaat in één DataFrame.

Deze oefening maakt deel uit van de cursus

Introductie tot Data Engineering

Cursus bekijken

Oefeninstructies

  • Maak de SELECT-instructie af zodat deze "Customer" met de tabel "Order" joint.
  • Print de kolom id van data. Wat valt je op?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Complete the SELECT statement
data = pd.read_sql("""
SELECT * FROM "Customer"
INNER JOIN "____"
ON "Order"."____"="Customer"."____"
""", db_engine)

# Show the id column of data
print(data.____)
Code bewerken en uitvoeren