Erste SchritteKostenlos loslegen

Erstellen einer SparkSession

Wir haben bereits eine SparkSession für dich erstellt, die spark heißt. Aber was ist, wenn du dir nicht sicher bist, ob es schon eine gibt? Wenn du mehrere SparkSessions und SparkContexts erstellst, kann das zu Problemen führen, daher ist es am besten, die Methode SparkSession.builder.getOrCreate() zu verwenden. Diese Funktion gibt eine bestehende SparkSession zurück, wenn es bereits eine in der Umgebung gibt, oder erstellt eine neue, falls nötig!

Diese Übung ist Teil des Kurses

Einführung in PySpark

Kurs anzeigen

Anleitung zur Übung

  • Importiere SparkSession von pyspark.sql.
  • Erstelle eine neue SparkSession mit dem Namen my_spark unter Verwendung von SparkSession.builder.getOrCreate().
  • Gib my_spark auf der Konsole aus, um zu überprüfen, ob es eine SparkSession ist.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Import SparkSession from pyspark.sql
from ____ import ____

# Create my_spark
my_spark = ____

# Print my_spark
print(____)
Bearbeiten und Ausführen von Code