CommencerCommencer gratuitement

Détecter des données textuelles incohérentes

Vous venez d’apprendre que l’équipe du support client souhaite poser des questions de suivi aux participants de l’enquête SFO. Cependant, l’autocomposeur utilisé par le centre d’appels n’arrive pas à interpréter tous les numéros de téléphone, car ils ne suivent pas le même format. Après vérification, vous avez constaté que certains numéros sont écrits avec des tirets (-) et d’autres avec des parenthèses ((,)). Dans cet exercice, vous allez identifier les numéros concernés afin de savoir lesquels doivent être corrigés.

dplyr et stringr sont chargés, et sfo_survey est disponible.

Cet exercice fait partie du cours

Nettoyer des données avec R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Filter for rows with "-" in the phone column
sfo_survey %>%
  filter(___)
Modifier et exécuter le code