MulaiMulai sekarang secara gratis

Mengaitkan atau tidak?

Mirip dengan join, record linkage adalah tindakan mengaitkan data dari sumber berbeda yang merujuk pada entitas yang sama. Namun tidak seperti join, record linkage tidak memerlukan kecocokan persis antara pasangan data yang berbeda, dan sebagai gantinya dapat menemukan kecocokan dekat menggunakan kemiripan string. Inilah sebabnya record linkage efektif ketika tidak ada kunci unik bersama di antara sumber data yang dapat Anda andalkan saat mengaitkan sumber data, seperti pengenal unik.

Dalam latihan ini, Anda akan mengklasifikasikan setiap kartu apakah itu masalah join tradisional, atau record linkage.

Latihan ini adalah bagian dari kursus

Membersihkan Data di Python

Lihat Kursus

Latihan interaktif praktis

Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.

Mulai berolahraga