Prueba con otro nombre
Sigues trabajando en tu análisis de sentimiento de Twitter. Ahora debes analizar algunas cosas que han llamado tu atención. Te has dado cuenta de que hay direcciones de correo electrónico insertadas en algunos tuits. Tienes curiosidad por saber cuál es el nombre más común.
Quieres extraer la primera parte de la dirección de correo electrónico. Por ejemplo, si tienes la dirección de correo electrónico [email protected]
, solo te interesa marysmith90
.
Tienes que buscar toda la expresión. Así te aseguras de extraer solo los nombres presentes en las direcciones de correo electrónico. Además, solo te interesan los nombres que contengan letras mayúsculas (por ejemplo, A,B, Z) o minúsculas (por ejemplo, a, d, z) y números.
La lista sentiment_analysis
, que contiene el texto de tres tuits, y el módulo re
ya se han cargado en tu sesión. Puedes utilizar para visualizarlo en el shell IPython.
Este ejercicio forma parte del curso
Expresiones regulares en Python
Instrucciones del ejercicio
- Completa la regex para buscar la dirección de correo electrónico capturando solo la parte del nombre. La parte del nombre aparece antes de
@
. - Busca todas las instancias de la regex en cada elemento del análisis de
sentiment_analysis
. Asígnala a la variableemail_matched
. - Completa el método
.format()
para imprimir los resultados capturados en cada elemento del análisis desentiment_analysis
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Write a regex that matches email
regex_email = r"___[____]____\S+"
for tweet in sentiment_analysis:
# Find all matches of regex in each tweet
email_matched = re.____(____, ____)
# Complete the format method to print the results
print("Lists of users found in this tweet: {}".format(____))