1. Learn
  2. /
  3. 课程
  4. /
  5. Python 数据清洗

Connected

道练习

相似的餐厅

在上一个练习中,您已经在 restaurants 和 restaurants_new 之间生成了配对,用于通过记录链接将两个 DataFrame 干净地合并。

进行记录链接时,您可以在不同列之间使用多种匹配方式,包括精确匹配、字符串相似度等。

现在配对已生成并存放在 pairs 中,您将为每一对记录在 city 和 cuisine_type 列中查找精确匹配,并在 rest_name 列中查找相似字符串。两个库 pandas 和 recordlinkage 已载入到您的环境中。

说明 1 / 共 4 个

undefined XP
    1
    2
    3
    4
  • 使用 recordlinkage.Compare() 函数实例化一个比较对象。