Vergelijkbare restaurants
In de vorige oefening heb je paren gegenereerd tussen restaurants en restaurants_new om beide DataFrames netjes te mergen via record linkage.
Bij record linkage kun je op verschillende manieren overeenkomsten zoeken tussen kolommen van je DataFrames, zoals exacte matches, string-overeenkomsten en meer.
Nu de paren zijn gegenereerd en opgeslagen in pairs, ga je exacte matches zoeken in de kolommen city en cuisine_type voor elk paar, en vergelijkbare strings voor elk paar in de kolom rest_name. Beide DataFrames, pandas en recordlinkage staan in je omgeving.
Deze oefening maakt deel uit van de cursus
Data opschonen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a comparison object
comp_cl = ____