Restaurants similaires
Dans le dernier exercice, vous avez généré des paires entre restaurants
et restaurants_new
afin de fusionner proprement les deux DataFrames à l'aide du couplage d'enregistrements.
Lors de la liaison d'enregistrements, vous pouvez effectuer différents types de correspondance entre les différentes colonnes de vos DataFrames, notamment des correspondances exactes, des similitudes de chaînes, etc.
Maintenant que vos paires ont été générées et enregistrées dans pairs
, vous trouverez les correspondances exactes dans les colonnes city
et cuisine_type
entre chaque paire, ainsi que les chaînes similaires pour chaque paire dans la colonne rest_name
. Les deux DataFrames, pandas
et recordlinkage
, se trouvent dans votre environnement.
Cet exercice fait partie du cours
Nettoyage des données dans Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a comparison object
comp_cl = ____