¿Son bots?
La empresa en la que trabajas te ha pedido que realices un análisis de sentimiento utilizando un conjunto de datos con tuits. En primer lugar, tienes que hacer limpieza y extraer algo de información.
Mientras imprimes texto, te das cuenta de que algunos tuits contienen menciones de usuarios. Algunas de estas menciones siguen un patrón muy extraño. Algunos ejemplos que te llaman la atención: @robot3!
, @robot5&
y @robot7#
Para analizar si esos usuarios son bots, harás una prueba de concepto con un tuit y los extraerás utilizando el método .findall()
.
Debes anotar algunos metacaracteres útiles para más adelante:
\d
: dígito
\w
: carácter de palabra
\W
: carácter no de palabra
\s
: espacio en blanco
El texto de un tuit está guardado en la variable sentiment_analysis
. Puedes utilizar print(sentiment_analysis)
para visualizarlo en el shell IPython.
Este ejercicio forma parte del curso
Expresiones regulares en Python
Instrucciones de ejercicio
- Importa el módulo
re
. - Escribe una regex que busque las menciones de usuario que empiecen por
@
y sigan el patrón (por ejemplo,@robot3!
). - Busca todas las instancias del patrón en la variable
sentiment_analysis
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import the re module
____
# Write the regex
regex = ____"____"
# Find all matches of regex
print(re.____(____, ____))