Tabellen betrachten
Sobald du eine SparkSession
erstellt hast, kannst du dich umsehen, um zu sehen, welche Daten sich in deinem Cluster befinden!
Deine SparkSession
hat ein Attribut namens catalog
, das alle Daten innerhalb des Clusters auflistet. Dieses Attribut hat einige Methoden, um verschiedene Informationen zu extrahieren.
Eine der nützlichsten ist die Methode .listTables()
, die die Namen aller Tabellen in deinem Cluster als Liste zurückgibt.
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Sieh nach, welche Tabellen sich in deinem Cluster befinden, indem du
spark.catalog.listTables()
aufrufst und das Ergebnis ausgibst!
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Print the tables in the catalog
print(spark.____.____())