Como criar uma SparkSession
Já criamos uma SparkSession
para você chamada spark
, mas e se você não tiver certeza de que já existe uma? A criação de várias SparkSession
e SparkContext
pode causar problemas, portanto é recomendável usar o método SparkSession.builder.getOrCreate()
. Isso retorna uma SparkSession
existente, se já houver uma no ambiente, ou cria uma nova, se necessário!
Este exercício faz parte do curso
Introdução ao PySpark
Instruções de exercício
- Importe
SparkSession
depyspark.sql
. - Crie uma nova
SparkSession
chamadamy_spark
usandoSparkSession.builder.getOrCreate()
. - Imprima
my_spark
no console para verificar se é umaSparkSession
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import SparkSession from pyspark.sql
from ____ import ____
# Create my_spark
my_spark = ____
# Print my_spark
print(____)