Faut-il établir un lien ou non ?
Tout comme les jointures, le couplage d'enregistrements consiste à relier des données provenant de différentes sources concernant la même entité. Cependant, contrairement aux jointures, le couplage d'enregistrements ne nécessite pas de correspondances exactes entre différentes paires de données, mais permet plutôt de trouver des correspondances proches à l'aide de la similarité des chaînes de caractères. C'est pourquoi le couplage d'enregistrements est efficace lorsqu'il n'existe aucune clé unique commune entre les sources de données sur laquelle vous pouvez vous appuyer pour coupler les sources de données, telle qu'un identifiant unique.
Dans cet exercice, vous classerez chaque carte selon qu'il s'agit d'un problème de jointure traditionnel ou d'un problème de liaison d'enregistrements.
Cet exercice fait partie du cours
Nettoyage des données en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
