LoslegenKostenlos loslegen

Tippfehler mit String-Abstand korrigieren

Einer der Datensätze, mit denen du in diesem Kapitel arbeiten wirst, zagat, ist eine Gruppe von Restaurants in New York, Los Angeles, Atlanta, San Francisco und Las Vegas. Die Daten stammen von Zagat, einem Unternehmen, das Restaurantkritiken sammelt, und beinhalten die Namen, Adressen, Telefonnummern und andere Informationen zu den Restaurants.

Die Spalte city enthält den Namen der Stadt, in der sich das Restaurant befindet. Allerdings gibt es in der Kolumne eine Reihe von Tippfehlern. Deine Aufgabe ist es, jede city einer der fünf richtig geschriebenen Städte aus dem cities Datenrahmen zuzuordnen.

dplyr und fuzzyjoin sind geladen, und zagat und cities sind verfügbar.

Diese Übung ist Teil des Kurses

Daten in R bereinigen

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Count the number of each city variation
zagat %>%
  count(___)
Code bearbeiten und ausführen