LoslegenKostenlos loslegen

Spark-Konfigurationen lesen

Du hast kürzlich einen Cluster über einen Cloud-Anbieter konfiguriert. Der einzige Zugang erfolgt über die test-shell oder deinen Python-Code. Du möchtest einige Spark-Einstellungen überprüfen, um die Konfiguration des Clusters zu bestätigen.

Das Objekt spark ist für die Nutzung verfügbar.

Diese Übung ist Teil des Kurses

Daten bereinigen mit PySpark

Kurs anzeigen

Anleitung zur Übung

  • Überprüfe den Namen der Spark-Anwendungsinstanz ("spark.app.name").
  • Bestimme den TCP-Port, an dem der Treiber läuft ("spark.driver.port").
  • Bestimme, wie viele Partitionen für Joins konfiguriert sind.
  • Zeige die Ergebnisse.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Name of the Spark application instance
app_name = spark.____.get(____)

# Driver TCP port
driver_tcp_port = ____

# Number of join partitions
num_partitions = ____('spark.sql.shuffle.____')

# Show the results
print("Name: %s" % ____)
print("Driver TCP port: %s" % ____)
print("Number of partitions: %s" % ____)
Code bearbeiten und ausführen