Das Datenbankschema
Inzwischen weißt du, dass SQL-Datenbanken immer ein Datenbankschema haben. In dem Video über Datenbanken hast du das folgende Diagramm gesehen:
In deiner lokalen Umgebung wird eine PostgreSQL-Datenbank eingerichtet, die dieses Datenbankschema enthält. Sie wurde mit einigen Beispieldaten gefüllt. Du kannst pandas
verwenden, um die Datenbank mit der Funktion read_sql()
abzufragen. Du musst ihr eine Datenbank-Engine übergeben, die bereits für dich definiert wurde und db_engine
heißt.
Das Paket pandas
, das als pd
importiert wird, speichert das Abfrageergebnis in einem DataFrame-Objekt, sodass du nach dem Abrufen der Ergebnisse aus der Datenbank jede DataFrame-Funktionalität darauf anwenden kannst.
Diese Übung ist Teil des Kurses
Einführung in die Datentechnik
Anleitung zur Übung
- Ergänze die Anweisung
SELECT
so, dass sie diefirst_name
und dielast_name
in der Tabelle"Customer"
auswählt. Achte darauf, dass du zuerst den Nachnamen und dann den Vornamen bestellst. - Verwende die Methode
.head()
, um die ersten3
Zeilen vondata
anzuzeigen. - Benutze
.info()
, um einige allgemeine Informationen überdata
anzuzeigen.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Complete the SELECT statement
data = pd.read_sql("""
SELECT first_name, ____ FROM "____"
ORDER BY ____, ____
""", db_engine)
# Show the first 3 rows of the DataFrame
print(data.head(____))
# Show the info of the DataFrame
print(data.____())