Bloqueio de pares
A Zagat e a Fodor's são empresas que reúnem avaliações de restaurantes. Os conjuntos de dados zagat
e fodors
contêm informações sobre vários restaurantes, inclusive endereços, números de telefone e tipos de cozinha. Alguns restaurantes aparecem em ambos os conjuntos de dados, mas não necessariamente têm o mesmo nome exato ou número de telefone anotado. Neste capítulo, você trabalhará para descobrir quais restaurantes aparecem em ambos os conjuntos de dados.
A primeira etapa para atingir esse objetivo é gerar pares de registros para que você possa compará-los. Neste exercício, você primeiro gerará todos os pares possíveis e, em seguida, usará a coluna city
recém-limpa como uma variável de bloqueio.
zagat
e fodors
estão disponíveis.
Este exercício faz parte do curso
Limpeza de dados no R
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Load reclin
___
# Generate all possible pairs
___