Restaurants similaires
Dans le dernier exercice, vous avez généré des paires entre restaurants et restaurants_new afin de fusionner proprement les deux DataFrame à l'aide du couplage de données.
Lors du couplage de données, il existe différents types de correspondance que vous pouvez effectuer entre les différentes colonnes de vos DataFrame, notamment les correspondances exactes, les similitudes de chaînes de caractères, etc.
Maintenant que vos paires ont été générées et enregistrées dans pairs, vous trouverez les correspondances exactes dans les colonnes city et cuisine_type entre chaque paire, ainsi que des chaînes similaires pour chaque paire dans la colonne rest_name. Les deux DataFrames, pandas et recordlinkage, se trouvent dans votre environnement.
Cet exercice fait partie du cours
Nettoyage des données en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a comparison object
comp_cl = ____