Typfouten oplossen met stringafstand
In dit hoofdstuk werk je met onder andere de gegevensset zagat, een verzameling restaurants in New York, Los Angeles, Atlanta, San Francisco en Las Vegas. De data komt van Zagat, een bedrijf dat restaurantreviews verzamelt, en bevat onder andere de restaurantnamen, adressen en telefoonnummers.
De kolom city bevat de stad waar het restaurant is gevestigd. Er staan echter allerlei typfouten in deze kolom. Jouw taak is om elke city te koppelen aan een van de vijf correct gespelde steden in de gegevensset cities.
dplyr en fuzzyjoin zijn geladen, en zagat en cities zijn beschikbaar.
Deze oefening maakt deel uit van de cursus
Data opschonen in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Count the number of each city variation
zagat %>%
count(___)