Inkonsistente Textdaten erkennen
Du hast kürzlich die Nachricht erhalten, dass das Customer-Support-Team den Teilnehmenden der SFO-Umfrage ein paar Nachfragen stellen möchte. Allerdings kann der Auto-Dialer des Callcenters nicht alle Telefonnummern verarbeiten, weil sie in unterschiedlichen Formaten vorliegen. Bei der Untersuchung hast du herausgefunden, dass einige Telefonnummern mit Bindestrichen (-) und andere mit Klammern ((,)) geschrieben sind. In dieser Übung findest du heraus, welche Telefonnummern diese Probleme haben, damit du weißt, welche korrigiert werden müssen.
dplyr und stringr sind geladen und sfo_survey ist verfügbar.
Diese Übung ist Teil des Kurses
<Kurs>Datenbereinigung in R</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Filter for rows with "-" in the phone column
sfo_survey %>%
filter(___)