Eles são bots?
A empresa para a qual você está trabalhando pediu que você realizasse uma análise de sentimento usando um conjunto de dados com tuítes. Antes de tudo, você precisa fazer uma limpeza e extrair algumas informações.
Ao imprimir alguns textos, você percebe que alguns tuítes contêm menções de usuários. Algumas dessas menções seguem um padrão muito estranho. Alguns exemplos que você pode observar: @robot3!
, @robot5&
e @robot7#
Para analisar se esses usuários são bots, você fará uma prova de conceito com um tuíte e os extrairá usando o método .findall()
.
Você anota alguns metacaracteres úteis para ajudá-lo mais tarde:
\d
: dígito
\w
: caractere palavra
\W
: caractere não-palavra
\s
: espaço em branco
O texto de um tuíte foi salvo na variável sentiment_analysis
. Você pode usar print(sentiment_analysis)
para visualizá-lo no Shell IPython.
Este exercício faz parte do curso
Expressões regulares em Python
Instruções de exercício
- Importe o módulo
re
. - Escreva uma regex que corresponda às menções do usuário que começam com
@
e seguem o padrão, por exemplo,@robot3!
. - Encontre todas as correspondências do padrão na variável
sentiment_analysis
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import the re module
____
# Write the regex
regex = ____"____"
# Find all matches of regex
print(re.____(____, ____))