Erste SchritteKostenlos loslegen

SQL kurz und bündig

Wenn du weitermachst, ist es hilfreich, wenn du ein Grundverständnis von SQL hast. Einen genaueren Blick darauf findest du hier.

Eine SQL-Abfrage gibt eine Tabelle zurück, die von einer oder mehreren Tabellen in einer Datenbank abgeleitet ist.

Jede SQL-Abfrage besteht aus Befehlen, die der Datenbank mitteilen, was du mit den Daten machen willst. Die beiden Befehle, die jede Abfrage enthalten muss, sind SELECT und FROM.

Auf den SELECT-Befehl folgen die Spalten, die du in der resultierenden Tabelle haben möchtest.

Auf den FROM-Befehl folgt der Name der Tabelle, die diese Spalten enthält. Die minimale SQL-Abfrage ist:

SELECT * FROM my_table;

Das * wählt alle Spalten aus, so dass die gesamte Tabelle my_table zurückgegeben wird.

Ähnlich wie bei .withColumn() kannst du spaltenweise Berechnungen innerhalb einer SELECT-Anweisung durchführen. Ein Beispiel:

SELECT origin, dest, air_time / 60 FROM flights;

gibt eine Tabelle mit Startort, Zielort und Dauer in Stunden für jeden Flug zurück.

Ein weiterer häufig verwendeter Befehl ist WHERE. Dieser Befehl filtert die Zeilen der Tabelle auf der Grundlage einer angegebenen logischen Bedingung. Die resultierende Tabelle enthält die Zeilen, auf die deine Bedingung zutrifft. Wenn du z. B. eine Tabelle mit Schülern und Noten hast, kannst du diesen Befehl verwenden:

SELECT * FROM students
WHERE grade = 'A';

um alle Spalten und Zeilen auszuwählen, die Informationen über Schüler enthalten, die eine Eins bekommen haben.

Welche der folgenden Abfragen liefert eine Tabelle mit Flugnummern und Flugzielen von Flügen, die länger als 10 Stunden gedauert haben?

Diese Übung ist Teil des Kurses

Einführung in PySpark

Kurs anzeigen

Interaktive Übung zum Anfassen

Setzen Sie die Theorie mit einer unserer interaktiven Übungen in die Tat um

Beginnen Sie mit dem Training