ComeçarComece gratuitamente

Lendo as configurações do Spark

Você configurou recentemente um cluster por meio de um provedor de nuvem. Seu único acesso é por meio do shell de comando ou do código Python. Você gostaria de verificar algumas configurações do Spark para validar a configuração do cluster.

O objeto spark está disponível para uso.

Este exercício faz parte do curso

Limpeza de dados com o PySpark

Ver Curso

Instruções de exercício

  • Verifique o nome da instância do aplicativo Spark ("spark.app.name").
  • Determine a porta TCP em que o driver é executado ("spark.driver.port").
  • Determine quantas partições estão configuradas para uniões.
  • Mostre os resultados.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Name of the Spark application instance
app_name = spark.____.get(____)

# Driver TCP port
driver_tcp_port = ____

# Number of join partitions
num_partitions = ____('spark.sql.shuffle.____')

# Show the results
print("Name: %s" % ____)
print("Driver TCP port: %s" % ____)
print("Number of partitions: %s" % ____)
Editar e executar código