Tautkan atau gabungkan?
Mirip dengan join, record linkage adalah tindakan menautkan data dari berbagai sumber yang merujuk pada entitas yang sama. Namun tidak seperti join, record linkage tidak memerlukan kecocokan persis antara pasangan data yang berbeda, dan sebagai gantinya dapat menemukan kecocokan dekat menggunakan kemiripan string. Inilah sebabnya mengapa record linkage efektif saat tidak ada kunci unik bersama di antara sumber data yang dapat Anda andalkan saat menautkan sumber data, seperti pengenal unik.
Dalam latihan ini, Anda akan menentukan metode mana yang paling tepat untuk menyelesaikan tiap masalah.
Latihan ini merupakan bagian dari kursus
Membersihkan Data di R
Latihan interaktif langsung
Ubah teori menjadi aksi dengan salah satu latihan interaktif kami
Mulai latihan