ComenzarEmpieza gratis

Buscar una subcadena

Es un nuevo día de trabajo y debes seguir limpiando tu conjunto de datos para el proyecto de previsión sobre la película. Mientras exploras el conjunto de datos, observas un patrón extraño: hay algunas palabras repetidas consecutivas entre el carácter de la posición 37 y el carácter de la posición 41. Decides escribir una función para averiguar qué críticas de la película presentan esta peculiaridad, recordando que la posición final que especifiques no es inclusiva. Si detectas la palabra, también quieres sustituir la cadena por una sola instancia de la palabra.

Completa la declaración if-else siguiendo las instrucciones.

El texto de tres críticas de la película ya está guardado en la variable movies. Puedes utilizar print(movies) para ver la variable en el shell IPython.

Este ejercicio forma parte del curso

Expresiones regulares en Python

Ver curso

Instrucciones de ejercicio

  • Comprueba si la subcadena actor aparece entre los caracteres con índice 37 y 41, inclusive. Si no se detecta, imprime la declaración Word not found.
  • Sustituye actor actor por la subcadena actor si actor solo aparece dos veces.
  • Sustituye actor actor actor por la subcadena actor si actor aparece tres veces.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

for movie in movies:
  	# If actor is not found between character 37 and 41 inclusive
    # Print word not found
    if movie.find("____", ____, ____) == ____:
        print("Word not found")
    # Count occurrences and replace two with one
    elif movie.____("____") == 2:  
        print(movie.replace("____", "____"))
    else:
        # Replace three occurrences with one
        print(movie.replace("____", "____"))
Editar y ejecutar código