Aan de slagGa gratis aan de slag

Een SparkSession maken

We hebben al een SparkSession voor je aangemaakt met de naam spark, maar wat als je niet zeker weet of die er al is? Meerdere SparkSessions en SparkContexts maken kan problemen geven, dus het is best practice om de methode SparkSession.builder.getOrCreate() te gebruiken. Die geeft een bestaande SparkSession terug als er al één in de omgeving is, of maakt er anders een nieuwe aan!

Deze oefening maakt deel uit van de cursus

Basis van PySpark

Cursus bekijken

Oefeninstructies

  • Importeer SparkSession uit pyspark.sql.
  • Maak een nieuwe SparkSession met de naam my_spark met SparkSession.builder.getOrCreate().
  • Print my_spark naar de console om te controleren dat het een SparkSession is.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import SparkSession from pyspark.sql
from ____ import ____

# Create my_spark
my_spark = ____

# Print my_spark
print(____)
Code bewerken en uitvoeren