LoslegenKostenlos loslegen

Tippfehler mit String-Distanz korrigieren

In diesem Kapitel arbeitest du mit dem Datensatz zagat, einer Sammlung von Restaurants in New York, Los Angeles, Atlanta, San Francisco und Las Vegas. Die Daten stammen von Zagat, einem Unternehmen, das Restaurantbewertungen sammelt, und enthalten unter anderem Restaurantnamen, Adressen, Telefonnummern sowie weitere Informationen.

Die Spalte city enthält den Namen der Stadt, in der sich das Restaurant befindet. Allerdings gibt es in dieser Spalte einige Tippfehler. Deine Aufgabe ist es, jede city einem der fünf korrekt geschriebenen Städtenamen im Data Frame cities zuzuordnen.

dplyr und fuzzyjoin sind geladen, und zagat sowie cities sind verfügbar.

Diese Übung ist Teil des Kurses

Datenbereinigung in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Count the number of each city variation
zagat %>%
  count(___)
Code bearbeiten und ausführen