Spark, Hadoop, dan Hive
Anda telah melihat cukup banyak proyek open source di video sebelumnya: Hadoop, Hive, dan PySpark. Mudah untuk tertukar di antara proyek-proyek ini.
Mereka memiliki beberapa kesamaan: semuanya saat ini dikelola oleh Apache Software Foundation, dan semuanya pernah digunakan untuk pemrosesan paralel berskala besar. Bisakah Anda menemukan perbedaannya?
Latihan ini merupakan bagian dari kursus
Pengantar Data Engineering
Latihan interaktif langsung
Ubah teori menjadi aksi dengan salah satu latihan interaktif kami
Mulai latihan