ComenzarEmpieza gratis

Pares de restaurantes

En la última lección, limpiaste el conjunto de datos restaurants para dejarlo listo para construir un motor de recomendación de restaurantes. Tienes un nuevo DataFrame llamado restaurants_new con nuevos restaurantes para entrenar tu modelo, que ha sido extraído de una nueva fuente de datos.

Ya has limpiado las columnas cuisine_type y city utilizando las técnicas aprendidas a lo largo del curso. Sin embargo, has visto duplicados con erratas en los nombres de los restaurantes que requieren la vinculación de registros en lugar de uniones con restaurants.

En este ejercicio, realizarás el primer paso de la vinculación de registros y generarás posibles pares de filas entre restaurants y restaurants_new. Ambos DataFrames, pandas y recordlinkage están en tu entorno.

Este ejercicio forma parte del curso

Limpieza de datos en Python

Ver curso

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Create an indexer and object and find possible pairs
indexer = ____

# Block pairing on cuisine_type
indexer.____(____)

# Generate pairs
pairs = indexer.____(____, ____)
Editar y ejecutar código