CommencerCommencez gratuitement

Créer une session SparkSession

Nous avons déjà créé pour vous un site SparkSession appelé spark, mais que faire si vous n'êtes pas sûr qu'il en existe déjà un ? La création de plusieurs SparkSessions et SparkContexts peut entraîner des problèmes, c'est pourquoi il est préférable d'utiliser la méthode SparkSession.builder.getOrCreate(). Cette fonction renvoie une adresse SparkSession existante s'il y en a déjà une dans l'environnement, ou en crée une nouvelle si nécessaire !

Cet exercice fait partie du cours

<cours>Introduction à PySpark</cours>
Voir le cours

Instructions de l’exercice

  • Importez SparkSession à partir de pyspark.sql.
  • Créez un nouveau site SparkSession appelé my_spark en utilisant SparkSession.builder.getOrCreate().
  • Imprimez my_spark sur la console pour vérifier qu'il s'agit bien de SparkSession.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import SparkSession from pyspark.sql
from ____ import ____

# Create my_spark
my_spark = ____

# Print my_spark
print(____)
Modifier et exécuter le code