Tente outro nome
Você ainda está trabalhando na sua análise de sentimentos do Twitter. Você analisa agora alguns aspectos que chamaram sua atenção. Você notou que há endereços de e-mail inseridos em alguns tuítes. Agora, você quer saber qual é o nome mais comum.
Você deseja extrair a primeira parte do e-mail. Por exemplo, se você tiver o e-mail [email protected]
, estará interessado apenas em marysmith90
.
Você precisa fazer a correspondência com a expressão inteira. Assim, você se certifica de extrair apenas os nomes presentes nos e-mails. Além disso, você só tem interesse em nomes que contenham letras maiúsculas (por exemplo, A, B, Z) ou minúsculas (por exemplo, a, d, z) e números.
A lista sentiment_analysis
contendo o texto de três tuítes, bem como o módulo re
, foram carregados em sua sessão. Você pode usar para visualizá-lo no Shell IPython.
Este exercício faz parte do curso
Expressões regulares em Python
Instruções de exercício
- Complete a regex para corresponder ao e-mail capturando apenas a parte do nome. A parte do nome aparece antes de
@
. - Encontre todas as correspondências da regex em cada elemento da análise
sentiment_analysis
. Atribua-a à variávelemail_matched
. - Complete o método
.format()
para imprimir os resultados capturados em cada elemento da análisesentiment_analysis
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Write a regex that matches email
regex_email = r"___[____]____\S+"
for tweet in sentiment_analysis:
# Find all matches of regex in each tweet
email_matched = re.____(____, ____)
# Complete the format method to print the results
print("Lists of users found in this tweet: {}".format(____))