ComenzarEmpieza gratis

Bloqueo de pares

Zagat y Fodor's son empresas que recopilan reseñas de restaurantes. Los conjuntos de datos zagat y fodors contienen información sobre diversos restaurantes, como direcciones, números de teléfono y tipos de cocina. Algunos restaurantes aparecen en ambos conjuntos de datos, pero no necesariamente tienen escrito el mismo nombre exacto o el mismo número de teléfono. En este capítulo, trabajará para averiguar qué restaurantes aparecen en ambos conjuntos de datos.

El primer paso hacia este objetivo es generar pares de registros para poder compararlos. En este ejercicio, primero generará todos los pares posibles y, a continuación, utilizará su columna city recién limpiada como variable de bloqueo.

zagat y fodors están disponibles.

Este ejercicio forma parte del curso

Limpieza de datos en R

Ver curso

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Load reclin
___

# Generate all possible pairs
___
Editar y ejecutar código