ComeçarComece gratuitamente

Como criar uma SparkSession

Já criamos uma SparkSession para você chamada spark, mas e se você não tiver certeza de que já existe uma? A criação de várias SparkSession e SparkContext pode causar problemas, portanto é recomendável usar o método SparkSession.builder.getOrCreate(). Isso retorna uma SparkSession existente, se já houver uma no ambiente, ou cria uma nova, se necessário!

Este exercício faz parte do curso

Introdução ao PySpark

Ver Curso

Instruções de exercício

  • Importe SparkSession de pyspark.sql.
  • Crie uma nova SparkSession chamada my_spark usando SparkSession.builder.getOrCreate().
  • Imprima my_spark no console para verificar se é uma SparkSession.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import SparkSession from pyspark.sql
from ____ import ____

# Create my_spark
my_spark = ____

# Print my_spark
print(____)
Editar e executar código