Detecção de dados de texto inconsistentes
Você recebeu recentemente a notícia de que a equipe de suporte ao cliente deseja fazer algumas perguntas de acompanhamento aos participantes da pesquisa SFO. No entanto, o discador automático que a central de atendimento usa não consegue analisar todos os números de telefone, pois todos estão em formatos diferentes. Após algumas investigações, você descobriu que alguns números de telefone são escritos com hífens (-
) e outros são escritos com parênteses ((
,)
). Neste exercício, você descobrirá quais números de telefone têm esses problemas para saber quais precisam ser corrigidos.
dplyr
e stringr
são carregados, e sfo_survey
está disponível.
Este exercício faz parte do curso
Limpeza de dados no R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Filter for rows with "-" in the phone column
sfo_survey %>%
filter(___)