Comece agoraComece grátis

Análise do SparkContext

Neste exercício, você vai conhecer melhor o SparkContext.

Você provavelmente perceberá que o código leva mais tempo para ser executado do que o esperado. Isso ocorre porque o Spark é um software robusto. A inicialização leva mais tempo do que o habitual. Você também pode descobrir que a execução de cálculos mais simples pode demorar mais do que o esperado. Isso se deve ao fato de que todos os mecanismos de otimização do Spark foram projetados para operações complicadas com grandes conjuntos de dados. Isso significa que, para problemas simples ou pequenos, o Spark pode ter um desempenho pior do que algumas outras soluções!

Este exercicio faz parte do curso

Fundamentos do PySpark

Ver curso

Instruções do exercicio

Conheça o SparkContext.

  • Chame print() com sc para verificar se há um SparkContext em seu ambiente.
  • Use print() para imprimir sc.version e ver qual versão do Spark está em execução no seu cluster.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Verify SparkContext
print(____)

# Print Spark version
print(____)
Editar e Executar Código