Tabellen betrachten
Sobald du eine SparkSession erstellt hast, kannst du dich umsehen, um zu sehen, welche Daten sich in deinem Cluster befinden!
Deine SparkSession hat ein Attribut namens catalog, das alle Daten innerhalb des Clusters auflistet. Dieses Attribut hat einige Methoden, um verschiedene Informationen zu extrahieren.
Eine der nützlichsten ist die Methode .listTables(), die die Namen aller Tabellen in deinem Cluster als Liste zurückgibt.
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Sieh nach, welche Tabellen sich in deinem Cluster befinden, indem du
spark.catalog.listTables()aufrufst und das Ergebnis ausgibst!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print the tables in the catalog
print(spark.____.____())