Inconsistente tekstgegevens opsporen
Je hebt onlangs gehoord dat het klantenserviceteam enkele vervolgvragen wil stellen aan de SFO-enquêtedeelnemers. Alleen kan de autodialer die het callcenter gebruikt niet alle telefoonnummers verwerken, omdat ze in verschillende notaties staan. Na wat onderzoek ontdekte je dat sommige telefoonnummers met koppeltekens (-) zijn geschreven en sommige met haakjes ((,)). In deze oefening ga je uitzoeken welke telefoonnummers deze problemen hebben, zodat je weet welke moeten worden aangepast.
dplyr en stringr zijn geladen en sfo_survey is beschikbaar.
Deze oefening maakt deel uit van de cursus
Data opschonen in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Filter for rows with "-" in the phone column
sfo_survey %>%
filter(___)