Buscar una subcadena
Es un nuevo día de trabajo y debes seguir limpiando tu conjunto de datos para el proyecto de previsión sobre la película. Mientras exploras el conjunto de datos, observas un patrón extraño: hay algunas palabras repetidas consecutivas entre el carácter de la posición 37 y el carácter de la posición 41. Decides escribir una función para averiguar qué críticas de la película presentan esta peculiaridad, recordando que la posición final que especifiques no es inclusiva. Si detectas la palabra, también quieres sustituir la cadena por una sola instancia de la palabra.
Completa la declaración if-else siguiendo las instrucciones.
El texto de tres críticas de la película ya está guardado en la variable movies
. Puedes utilizar print(movies)
para ver la variable en el shell IPython.
Este ejercicio forma parte del curso
Expresiones regulares en Python
Instrucciones de ejercicio
- Comprueba si la subcadena
actor
aparece entre los caracteres con índice37
y41
, inclusive. Si no se detecta, imprime la declaraciónWord not found
. - Sustituye
actor actor
por la subcadenaactor
siactor
solo aparece dos veces. - Sustituye
actor actor actor
por la subcadenaactor
siactor
aparece tres veces.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
for movie in movies:
# If actor is not found between character 37 and 41 inclusive
# Print word not found
if movie.find("____", ____, ____) == ____:
print("Word not found")
# Count occurrences and replace two with one
elif movie.____("____") == 2:
print(movie.replace("____", "____"))
else:
# Replace three occurrences with one
print(movie.replace("____", "____"))