or
Latihan ini merupakan bagian dari kursus
Di bab ini, Anda akan mempelajari apa itu data engineering dan mengapa permintaan terhadapnya semakin meningkat. Anda kemudian akan mengetahui posisi rekayasa data dalam siklus hidup data science, bagaimana perbedaan antara data engineer dan data scientist, serta mendapatkan pengenalan tentang pipeline data lengkap pertama Anda.
Latihan Saat Ini
Saatnya membahas penyimpanan data—salah satu tanggung jawab utama bagi seorang data engineer. Di bab ini, Anda akan mempelajari bagaimana data engineer mengelola berbagai struktur data, bekerja dengan SQL—bahasa pemrograman pilihan untuk melakukan query dan menyimpan data, serta menerapkan solusi penyimpanan data yang sesuai menggunakan data lake dan data warehouse.
Data engineer memudahkan pekerjaan data scientist dengan menyiapkan data mentah untuk analisis menggunakan berbagai teknik pemrosesan pada setiap tahap. Langkah-langkah ini perlu digabungkan untuk membuat pipeline, di sinilah otomatisasi mulai berperan. Akhirnya, data engineer menggunakan komputasi paralel dan komputasi cloud untuk menjaga pipeline tetap berjalan lancar.