ComeçarComece gratuitamente

Tente outro nome

Você ainda está trabalhando na sua análise de sentimentos do Twitter. Você analisa agora alguns aspectos que chamaram sua atenção. Você notou que há endereços de e-mail inseridos em alguns tuítes. Agora, você quer saber qual é o nome mais comum.

Você deseja extrair a primeira parte do e-mail. Por exemplo, se você tiver o e-mail [email protected], estará interessado apenas em marysmith90.
Você precisa fazer a correspondência com a expressão inteira. Assim, você se certifica de extrair apenas os nomes presentes nos e-mails. Além disso, você só tem interesse em nomes que contenham letras maiúsculas (por exemplo, A, B, Z) ou minúsculas (por exemplo, a, d, z) e números.

A lista sentiment_analysis contendo o texto de três tuítes, bem como o módulo re, foram carregados em sua sessão. Você pode usar para visualizá-lo no Shell IPython.

Este exercício faz parte do curso

Expressões regulares em Python

Ver Curso

Instruções de exercício

  • Complete a regex para corresponder ao e-mail capturando apenas a parte do nome. A parte do nome aparece antes de @.
  • Encontre todas as correspondências da regex em cada elemento da análise sentiment_analysis. Atribua-a à variável email_matched.
  • Complete o método .format() para imprimir os resultados capturados em cada elemento da análise sentiment_analysis.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Write a regex that matches email
regex_email = r"___[____]____\S+"

for tweet in sentiment_analysis:
    # Find all matches of regex in each tweet
    email_matched = re.____(____, ____)

    # Complete the format method to print the results
    print("Lists of users found in this tweet: {}".format(____))
Editar e executar código