Spark, Hadoop und Hive
Im vorherigen Video hast du schon einige Open-Source-Projekte kennengelernt. Es gibt Hadoop, Hive und PySpark. Es ist leicht, zwischen diesen Projekten durcheinander zu kommen.
Sie haben ein paar Dinge gemeinsam: Sie werden derzeit alle von der Apache Software Foundation verwaltet und sie wurden alle für massive Parallelverarbeitung eingesetzt. Kannst du die Unterschiede erkennen?
Diese Übung ist Teil des Kurses
Einführung in die Datentechnik
Interaktive Übung
Setze die Theorie in einer unserer interaktiven Übungen in die Praxis um
