LoslegenKostenlos loslegen

Das Datenbankschema

Mittlerweile weißt du, dass SQL-Datenbanken immer ein Datenbankschema haben. Im Video über Datenbanken hast du das folgende Diagramm gesehen:

Datenbankschema für Kunden und Bestellungen

In deiner lokalen Umgebung ist eine PostgreSQL-Datenbank eingerichtet, die dieses Datenbankschema enthält. Es wurde mit ein paar Beispieldaten gefüllt. Du kannst pandas nutzen, um die Datenbank mit der Funktion read_sql() abzufragen. Du musst ihr eine Datenbank-Engine übergeben, die für dich definiert wurde und db_engine heißt.

Das Paket „ pandas “, das als „ pd “ importiert wird, speichert das Abfrageergebnis in einem DataFrame-Objekt, sodass du nach dem Abrufen der Ergebnisse aus der Datenbank alle DataFrame-Funktionen darauf anwenden kannst.

Diese Übung ist Teil des Kurses

Einführung in das Data Engineering

Kurs anzeigen

Anleitung zur Übung

  • Vervollständige die Anweisung SELECT, sodass sie die Spalten first_name und last_name aus der Tabelle "Customer" auswählt. Stell sicher, dass du zuerst nach Nachnamen und dann nach Vornamen ordnest.
  • Verwende die Methode .head(), um die ersten 3 Zeilen von data anzuzeigen.
  • Nutze .info(), um ein paar allgemeine Informationen über data anzuzeigen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Complete the SELECT statement
data = pd.read_sql("""
SELECT first_name, ____ FROM "____"
ORDER BY ____, ____
""", db_engine)

# Show the first 3 rows of the DataFrame
print(data.head(____))

# Show the info of the DataFrame
print(data.____())
Code bearbeiten und ausführen