Pares de restaurantes
En la última lección, limpiaste el conjunto de datos restaurants para dejarlo listo para construir un motor de recomendación de restaurantes. Tienes un nuevo DataFrame llamado restaurants_new con nuevos restaurantes para entrenar tu modelo, que ha sido extraído de una nueva fuente de datos.
Ya has limpiado las columnas cuisine_type y city utilizando las técnicas aprendidas a lo largo del curso. Sin embargo, has visto duplicados con erratas en los nombres de los restaurantes que requieren la vinculación de registros en lugar de uniones con restaurants.
En este ejercicio, realizarás el primer paso de la vinculación de registros y generarás posibles pares de filas entre restaurants y restaurants_new. Ambos DataFrames, pandas y recordlinkage están en tu entorno.
Este ejercicio forma parte del curso
Limpieza de datos en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create an indexer and object and find possible pairs
indexer = ____
# Block pairing on cuisine_type
indexer.____(____)
# Generate pairs
pairs = indexer.____(____, ____)