Aan de slagGa gratis aan de slag

Koppelen of niet koppelen?

Net als joins is record linkage het koppelen van data uit verschillende bronnen over dezelfde entiteit. Maar in tegenstelling tot joins vereist record linkage geen exacte overeenkomsten tussen paren data; het kan juist bijna-overeenkomsten vinden met behulp van tekenreeksvergelijking. Daarom is record linkage effectief wanneer er geen gemeenschappelijke, unieke sleutels zijn tussen de databronnen waarop je kunt vertrouwen, zoals een unieke id.

In deze oefening classificeer je elke kaart als een traditioneel join-probleem of een record-linkage-probleem.

Deze oefening maakt deel uit van de cursus

Data opschonen in Python

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen