Erkennen von inkonsistenten Textdaten
Du hast vor kurzem die Nachricht erhalten, dass das Kundenserviceteam den Teilnehmern der Umfrage SFO einige Folgefragen stellen möchte. Die automatische Wählhilfe, die das Call Center verwendet, kann jedoch nicht alle Telefonnummern analysieren, da sie alle in unterschiedlichen Formaten vorliegen. Nach einigen Nachforschungen hast du herausgefunden, dass manche Telefonnummern mit Bindestrichen (-
) und manche mit Klammern ((
,)
) geschrieben werden. In dieser Übung wirst du herausfinden, welche Telefonnummern diese Probleme haben, damit du weißt, welche du reparieren musst.
dplyr
und stringr
sind geladen und sfo_survey
ist verfügbar.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Filter for rows with "-" in the phone column
sfo_survey %>%
filter(___)