Aan de slagGa gratis aan de slag

Koppelen of joinen?

Net als bij joins koppel je met record linkage gegevens uit verschillende bronnen die over dezelfde entiteit gaan. Maar in tegenstelling tot joins vraagt record linkage geen exacte overeenkomsten tussen paren gegevens; het kan juist bijna-overeenkomsten vinden met behulp van tekstsimilariteit. Daarom werkt record linkage goed wanneer er geen gemeenschappelijke unieke sleutels tussen de databronnen zijn waarop je kunt vertrouwen, zoals een unieke identifier.

In deze oefening bepaal je welke methode het beste is om elk probleem op te lossen.

Deze oefening maakt deel uit van de cursus

Data opschonen in R

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen