Bloqueo de pares
Zagat y Fodor's son empresas que recopilan reseñas de restaurantes. Los conjuntos de datos zagat
y fodors
contienen información sobre diversos restaurantes, como direcciones, números de teléfono y tipos de cocina. Algunos restaurantes aparecen en ambos conjuntos de datos, pero no necesariamente tienen escrito el mismo nombre exacto o el mismo número de teléfono. En este capítulo, trabajará para averiguar qué restaurantes aparecen en ambos conjuntos de datos.
El primer paso hacia este objetivo es generar pares de registros para poder compararlos. En este ejercicio, primero generará todos los pares posibles y, a continuación, utilizará su columna city
recién limpiada como variable de bloqueo.
zagat
y fodors
están disponibles.
Este ejercicio forma parte del curso
Limpieza de datos en R
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Load reclin
___
# Generate all possible pairs
___