Spark, Hadoop, dan Hive
Anda telah melihat cukup banyak proyek open source di video sebelumnya: Hadoop, Hive, dan PySpark. Mudah untuk tertukar di antara proyek-proyek ini.
Mereka memiliki beberapa kesamaan: semuanya saat ini dikelola oleh Apache Software Foundation, dan semuanya pernah digunakan untuk pemrosesan paralel berskala besar. Bisakah Anda menemukan perbedaannya?
Latihan ini adalah bagian dari kursus
Pengantar Data Engineering
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga