Détecter des données textuelles incohérentes
Vous venez d’apprendre que l’équipe du support client souhaite poser des questions de suivi aux participants de l’enquête SFO. Cependant, l’autocomposeur utilisé par le centre d’appels n’arrive pas à interpréter tous les numéros de téléphone, car ils ne suivent pas le même format. Après vérification, vous avez constaté que certains numéros sont écrits avec des tirets (-) et d’autres avec des parenthèses ((,)). Dans cet exercice, vous allez identifier les numéros concernés afin de savoir lesquels doivent être corrigés.
dplyr et stringr sont chargés, et sfo_survey est disponible.
Cet exercice fait partie du cours
Nettoyer des données avec R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Filter for rows with "-" in the phone column
sfo_survey %>%
filter(___)