LoslegenKostenlos starten

Erstelle eine SQL-Tabelle aus einem DataFrame

Ein DataFrame kann verwendet werden, um eine temporäre Tabelle zu erstellen. Eine temporäre Tabelle existiert nach dem Ende der Session nicht mehr. In der Spark-Dokumentation wird dieser Tabellentyp auch als SQL temporary view bezeichnet. Dort spricht man davon, den DataFrame als SQL temporary view zu registrieren. Dieser Befehl wird direkt auf dem DataFrame aufgerufen und erstellt eine Tabelle, falls sie noch nicht existiert, oder ersetzt sie mit den aktuellen Daten aus dem DataFrame, falls sie bereits existiert.

Diese Übung ist Teil des Kurses

<Kurs>Einführung in Spark SQL mit Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Lade CSV-Daten aus der Datei trainsched.txt in einen DataFrame in der Variablen df.
  • Erstelle aus df eine temporäre Tabelle. Nenne die Tabelle „table1“.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Load trainsched.txt
df = spark.____.____("trainsched.txt", header=True)

# Create temporary table called table1
df.____(____)
Code bearbeiten und ausführen