CommencerCommencer gratuitement

Restaurants similaires

Dans le dernier exercice, vous avez généré des paires entre restaurants et restaurants_new afin de fusionner proprement les deux DataFrames à l'aide du couplage d'enregistrements.

Lors de la liaison d'enregistrements, vous pouvez effectuer différents types de correspondance entre les différentes colonnes de vos DataFrames, notamment des correspondances exactes, des similitudes de chaînes, etc.

Maintenant que vos paires ont été générées et enregistrées dans pairs, vous trouverez les correspondances exactes dans les colonnes city et cuisine_type entre chaque paire, ainsi que les chaînes similaires pour chaque paire dans la colonne rest_name. Les deux DataFrames, pandas et recordlinkage, se trouvent dans votre environnement.

Cet exercice fait partie du cours

Nettoyage des données dans Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a comparison object
comp_cl = ____
Modifier et exécuter le code