Me encanta
Sigues trabajando en el proyecto de análisis de sentimiento de Twitter. En primer lugar, quieres identificar los tuits positivos sobre películas y conciertos.
Tu plan es encontrar todas las frases que contengan las palabras love, like o enjoy y capturar esa palabra. Limitarás los tuits centrándote en los que contengan las palabras movie o concert manteniendo la palabra en otro grupo. También guardarás el nombre de la película o el concierto.
Por ejemplo, si tienes la frase: I love the movie Avengers.
Debes buscar y capturar love
. Tienes que buscar y capturar movie
. Después, debes buscar y capturar todo lo demás hasta el punto.
La lista sentiment_analysis
, que contiene el texto de tres tuits, y el módulo re
ya se han cargado en tu sesión. Puedes utilizar para ver los datos en el shell IPython.
Este ejercicio forma parte del curso
Expresiones regulares en Python
Instrucciones de ejercicio
- Completa la expresión regular para capturar las palabras
love
,like
oenjoy
. Busca y captura las palabrasmovie
oconcert
. Busca y captura todo lo que aparezca hasta.
. - Busca todas las instancias de la regex en cada elemento de
sentiment_analysis
. Asígnalas apositive_matches
. - Completa el método
.format()
para imprimir los resultados contenidos enpositive_matches
para cada elemento desentiment_analysis
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Write a regex that matches sentences with the optional words
regex_positive = r"____.+?____\s____\."
for tweet in sentiment_analysis:
# Find all matches of regex in tweet
positive_matches = re.____(____, ____)
# Complete format to print out the results
print("Positive comments found ____".format(____))