LoslegenKostenlos loslegen

Linken oder joinen?

Ähnlich wie Joins bedeutet Record Linkage, Daten aus verschiedenen Quellen zur selben Entität zu verknüpfen. Im Gegensatz zu Joins erfordert Record Linkage jedoch keine exakten Übereinstimmungen zwischen unterschiedlichen Datenpaaren, sondern kann nahe Übereinstimmungen über String-Ähnlichkeit finden. Deshalb ist Record Linkage hilfreich, wenn es zwischen den Datenquellen keine gemeinsamen eindeutigen Schlüssel gibt, auf die du dich beim Verknüpfen verlassen kannst, wie etwa eine eindeutige ID.

In dieser Übung entscheidest du, welche Methode für jedes Problem am besten geeignet ist.

Diese Übung ist Teil des Kurses

Datenbereinigung in R

Kurs anzeigen

Interaktive Übung

In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.

Übung starten