Restaurantes similares
En el último ejercicio, generaste pares entre restaurants
y restaurants_new
en un esfuerzo por fusionar limpiamente ambos DataFrames utilizando la vinculación de registros.
Al realizar la vinculación de registros, hay diferentes tipos de coincidencias que puedes realizar entre las distintas columnas de tus DataFrames, incluyendo coincidencias exactas, similitudes de cadenas y más.
Ahora que tus pares se han generado y almacenado en pairs
, encontrarás coincidencias exactas en las columnas city
y cuisine_type
entre cada par, y cadenas similares para cada par en la columna rest_name
. Ambos DataFrames, pandas
y recordlinkage
están en tu entorno.
Este ejercicio forma parte del curso
Limpieza de datos en Python
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create a comparison object
comp_cl = ____