Spark, Hadoop e Hive
Você viu vários projetos de código aberto no vídeo anterior: Hadoop, Hive e PySpark. É fácil confundir esses projetos.
Eles têm algumas coisas em comum: todos são mantidos atualmente pela Apache Software Foundation e todos já foram usados para processamento massivamente paralelo. Consegue identificar as diferenças?
Este exercício faz parte do curso
Introdução à Engenharia de Dados
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício