Het databaseschema
Intussen weet je dat SQL-databases altijd een databaseschema hebben. In de video over databases zag je het volgende diagram:

Er is in je lokale omgeving een PostgreSQL-database opgezet met dit databaseschema. Deze is gevuld met enkele voorbeeldgegevens. Je kunt pandas gebruiken om de database te bevragen met de functie read_sql(). Je moet daarbij een database-engine doorgeven; die is al voor je gedefinieerd en heet db_engine.
Het pandas-pakket, geïmporteerd als pd, slaat het queryresultaat op in een DataFrame-object. Daarna kun je alle DataFrame-functionaliteit gebruiken op de resultaten uit de database.
Deze oefening maakt deel uit van de cursus
Introductie tot Data Engineering
Oefeninstructies
- Maak de
SELECT-query af zodat dezefirst_nameenlast_nameuit de tabel"Customer"selecteert. Zorg dat je eerst sorteert op achternaam en daarna op voornaam. - Gebruik de methode
.head()om de eerste3rijen vandatate tonen. - Gebruik
.info()om algemene informatie overdatate tonen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Complete the SELECT statement
data = pd.read_sql("""
SELECT first_name, ____ FROM "____"
ORDER BY ____, ____
""", db_engine)
# Show the first 3 rows of the DataFrame
print(data.head(____))
# Show the info of the DataFrame
print(data.____())