Varios interlocutores 1

Si tu objetivo es transcribir conversaciones, habrá más de una persona hablando. Sin embargo, como verás, la función recognize_google() solo transcribe el habla en un único bloque de texto.

En este archivo de audio se oyen tres interlocutores distintos.

Pero si lo transcribes tal cual, recognize_google() devuelve un único bloque de texto. Sigue siendo útil, pero no te indica qué dijo cada persona.

Veremos una alternativa a esto en el siguiente ejercicio.

El archivo de audio con varios interlocutores se ha importado y convertido a AudioData como multiple_speakers.

Este ejercicio forma parte del curso

Procesamiento del lenguaje hablado en Python

Ver curso

Instrucciones del ejercicio

Crea una instancia de Recognizer.
Reconoce la variable multiple_speakers usando la función recognize_google().
Establece el idioma a inglés de EE. UU. ("en-US").

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Create a recognizer class
recognizer = sr.____()

# Recognize the multiple speaker AudioData
text = recognizer.recognize_google(____, 
                       			   language=____)

# Print the text
print(text)

Editar y ejecutar código