Aan de slagGa gratis aan de slag

Het databaseschema

Intussen weet je dat SQL-databases altijd een databaseschema hebben. In de video over databases zag je het volgende diagram:

Database Schema for Customer and Order

Er is in je lokale omgeving een PostgreSQL-database opgezet met dit databaseschema. Deze is gevuld met enkele voorbeeldgegevens. Je kunt pandas gebruiken om de database te bevragen met de functie read_sql(). Je moet daarbij een database-engine doorgeven; die is al voor je gedefinieerd en heet db_engine.

Het pandas-pakket, geïmporteerd als pd, slaat het queryresultaat op in een DataFrame-object. Daarna kun je alle DataFrame-functionaliteit gebruiken op de resultaten uit de database.

Deze oefening maakt deel uit van de cursus

Introductie tot Data Engineering

Cursus bekijken

Oefeninstructies

  • Maak de SELECT-query af zodat deze first_name en last_name uit de tabel "Customer" selecteert. Zorg dat je eerst sorteert op achternaam en daarna op voornaam.
  • Gebruik de methode .head() om de eerste 3 rijen van data te tonen.
  • Gebruik .info() om algemene informatie over data te tonen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Complete the SELECT statement
data = pd.read_sql("""
SELECT first_name, ____ FROM "____"
ORDER BY ____, ____
""", db_engine)

# Show the first 3 rows of the DataFrame
print(data.head(____))

# Show the info of the DataFrame
print(data.____())
Code bewerken en uitvoeren