LoslegenKostenlos loslegen

Tabellen betrachten

Sobald du eine SparkSession erstellt hast, kannst du dich umsehen, um zu sehen, welche Daten sich in deinem Cluster befinden!

Deine SparkSession hat ein Attribut namens catalog, das alle Daten innerhalb des Clusters auflistet. Dieses Attribut hat einige Methoden, um verschiedene Informationen zu extrahieren.

Eine der nützlichsten ist die Methode .listTables(), die die Namen aller Tabellen in deinem Cluster als Liste zurückgibt.

Diese Übung ist Teil des Kurses

Einführung in PySpark

Kurs anzeigen

Anleitung zur Übung

  • Sieh nach, welche Tabellen sich in deinem Cluster befinden, indem du spark.catalog.listTables() aufrufst und das Ergebnis ausgibst!

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Print the tables in the catalog
print(spark.____.____())
Code bearbeiten und ausführen