CommencerCommencer gratuitement

Créer une session SparkSession

Nous avons déjà créé pour vous un site SparkSession appelé spark, mais que faire si vous n'êtes pas sûr qu'il en existe déjà un ? La création de plusieurs SparkSessions et SparkContexts peut entraîner des problèmes, c'est pourquoi il est préférable d'utiliser la méthode SparkSession.builder.getOrCreate(). Cette fonction renvoie une adresse SparkSession existante s'il y en a déjà une dans l'environnement, ou en crée une nouvelle si nécessaire !

Cet exercice fait partie du cours

Introduction à PySpark

Afficher le cours

Instructions

  • Importez SparkSession à partir de pyspark.sql.
  • Créez un nouveau site SparkSession appelé my_spark en utilisant SparkSession.builder.getOrCreate().
  • Imprimez my_spark sur la console pour vérifier qu'il s'agit bien de SparkSession.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import SparkSession from pyspark.sql
from ____ import ____

# Create my_spark
my_spark = ____

# Print my_spark
print(____)
Modifier et exécuter le code