Maak een SQL-tabel van een dataframe
Je kunt een dataframe gebruiken om een tijdelijke tabel te maken. Een tijdelijke tabel bestaat niet meer nadat de sessie eindigt. In de Spark-documentatie wordt dit type tabel ook een SQL temporary view genoemd. In de documentatie heet dit het registreren van het dataframe als een SQL temporary view. Dit commando roep je aan op het dataframe zelf; het maakt een tabel als die nog niet bestaat, en vervangt de bestaande tabel door de actuele data uit het dataframe als die al wel bestaat.
Deze oefening maakt deel uit van de cursus
Introductie tot Spark SQL in Python
Oefeninstructies
- Laad csv-gegevens uit het bestand
trainsched.txtin een dataframe in de variabeledf. - Maak een tijdelijke tabel van
df. Noem de tabel "table1".
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load trainsched.txt
df = spark.____.____("trainsched.txt", header=True)
# Create temporary table called table1
df.____(____)