Tippfehler mit String-Abstand korrigieren
Einer der Datensätze, mit denen du in diesem Kapitel arbeiten wirst, zagat
, ist eine Gruppe von Restaurants in New York, Los Angeles, Atlanta, San Francisco und Las Vegas. Die Daten stammen von Zagat, einem Unternehmen, das Restaurantkritiken sammelt, und beinhalten die Namen, Adressen, Telefonnummern und andere Informationen zu den Restaurants.
Die Spalte city
enthält den Namen der Stadt, in der sich das Restaurant befindet. Allerdings gibt es in der Kolumne eine Reihe von Tippfehlern. Deine Aufgabe ist es, jede city
einer der fünf richtig geschriebenen Städte aus dem cities
Datenrahmen zuzuordnen.
dplyr
und fuzzyjoin
sind geladen, und zagat
und cities
sind verfügbar.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Count the number of each city variation
zagat %>%
count(___)