Spark, Hadoop e Hive
Você viu vários projetos de código aberto no vídeo anterior: Hadoop, Hive e PySpark. É fácil confundir esses projetos.
Eles têm algumas coisas em comum: todos são mantidos atualmente pela Apache Software Foundation e todos já foram usados para processamento massivamente paralelo. Consegue identificar as diferenças?
Este exercicio faz parte do curso
Introdução à Engenharia de Dados
exercicio interativo prático
Transforme teoria em prática com um dos nossos exercicio interativos
Iniciar exercicio