ComenzarEmpieza gratis

Prueba con otro nombre

Sigues trabajando en tu análisis de sentimiento de Twitter. Ahora debes analizar algunas cosas que han llamado tu atención. Te has dado cuenta de que hay direcciones de correo electrónico insertadas en algunos tuits. Tienes curiosidad por saber cuál es el nombre más común.

Quieres extraer la primera parte de la dirección de correo electrónico. Por ejemplo, si tienes la dirección de correo electrónico [email protected], solo te interesa marysmith90.
Tienes que buscar toda la expresión. Así te aseguras de extraer solo los nombres presentes en las direcciones de correo electrónico. Además, solo te interesan los nombres que contengan letras mayúsculas (por ejemplo, A,B, Z) o minúsculas (por ejemplo, a, d, z) y números.

La lista sentiment_analysis, que contiene el texto de tres tuits, y el módulo re ya se han cargado en tu sesión. Puedes utilizar para visualizarlo en el shell IPython.

Este ejercicio forma parte del curso

Expresiones regulares en Python

Ver curso

Instrucciones del ejercicio

  • Completa la regex para buscar la dirección de correo electrónico capturando solo la parte del nombre. La parte del nombre aparece antes de @.
  • Busca todas las instancias de la regex en cada elemento del análisis de sentiment_analysis. Asígnala a la variable email_matched.
  • Completa el método .format() para imprimir los resultados capturados en cada elemento del análisis de sentiment_analysis.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Write a regex that matches email
regex_email = r"___[____]____\S+"

for tweet in sentiment_analysis:
    # Find all matches of regex in each tweet
    email_matched = re.____(____, ____)

    # Complete the format method to print the results
    print("Lists of users found in this tweet: {}".format(____))
Editar y ejecutar código