Aan de slagGa gratis aan de slag

Typfouten oplossen met stringafstand

In dit hoofdstuk werk je met onder andere de gegevensset zagat, een verzameling restaurants in New York, Los Angeles, Atlanta, San Francisco en Las Vegas. De data komt van Zagat, een bedrijf dat restaurantreviews verzamelt, en bevat onder andere de restaurantnamen, adressen en telefoonnummers.

De kolom city bevat de stad waar het restaurant is gevestigd. Er staan echter allerlei typfouten in deze kolom. Jouw taak is om elke city te koppelen aan een van de vijf correct gespelde steden in de gegevensset cities.

dplyr en fuzzyjoin zijn geladen, en zagat en cities zijn beschikbaar.

Deze oefening maakt deel uit van de cursus

Data opschonen in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Count the number of each city variation
zagat %>%
  count(___)
Code bewerken en uitvoeren