Tautkan atau gabungkan?
Mirip dengan join, record linkage adalah tindakan menautkan data dari berbagai sumber yang merujuk pada entitas yang sama. Namun tidak seperti join, record linkage tidak memerlukan kecocokan persis antara pasangan data yang berbeda, dan sebagai gantinya dapat menemukan kecocokan dekat menggunakan kemiripan string. Inilah sebabnya mengapa record linkage efektif saat tidak ada kunci unik bersama di antara sumber data yang dapat Anda andalkan saat menautkan sumber data, seperti pengenal unik.
Dalam latihan ini, Anda akan menentukan metode mana yang paling tepat untuk menyelesaikan tiap masalah.
Latihan ini adalah bagian dari kursus
Membersihkan Data di R
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga