Pair blocking
Zagat en Fodor's zijn allebei bedrijven die restaurantbeoordelingen verzamelen. De gegevenssets zagat en fodors bevatten allebei informatie over verschillende restaurants, zoals adressen, telefoonnummers en keukentypes. Sommige restaurants komen in beide gegevenssets voor, maar hebben niet per se exact dezelfde naam of hetzelfde telefoonnummer genoteerd. In dit hoofdstuk ga je uitzoeken welke restaurants in beide gegevenssets voorkomen.
De eerste stap naar dit doel is het genereren van paren van records zodat je ze kunt vergelijken. In deze oefening genereer je eerst alle mogelijke paren en gebruik je daarna je onlangs opgeschoonde kolom city als blockingvariabele.
zagat en fodors zijn beschikbaar.
Deze oefening maakt deel uit van de cursus
Data opschonen in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load reclin
___
# Generate all possible pairs
___