Pares de restaurantes
En la última lección, limpiaste el conjunto de datos restaurants
para dejarlo listo para construir un motor de recomendación de restaurantes. Tienes un nuevo DataFrame llamado restaurants_new
con nuevos restaurantes para entrenar tu modelo, que ha sido extraído de una nueva fuente de datos.
Ya has limpiado las columnas cuisine_type
y city
utilizando las técnicas aprendidas a lo largo del curso. Sin embargo, has visto duplicados con erratas en los nombres de los restaurantes que requieren la vinculación de registros en lugar de uniones con restaurants
.
En este ejercicio, realizarás el primer paso de la vinculación de registros y generarás posibles pares de filas entre restaurants
y restaurants_new
. Ambos DataFrames, pandas
y recordlinkage
están en tu entorno.
Este ejercicio forma parte del curso
Limpieza de datos en Python
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create an indexer and object and find possible pairs
indexer = ____
# Block pairing on cuisine_type
indexer.____(____)
# Generate pairs
pairs = indexer.____(____, ____)