Varios interlocutores 1
Si tu objetivo es transcribir conversaciones, habrá más de una persona hablando. Sin embargo, como verás, la función recognize_google() solo transcribe el habla en un único bloque de texto.
En este archivo de audio se oyen tres interlocutores distintos.
Pero si lo transcribes tal cual, recognize_google() devuelve un único bloque de texto. Sigue siendo útil, pero no te indica qué dijo cada persona.
Veremos una alternativa a esto en el siguiente ejercicio.
El archivo de audio con varios interlocutores se ha importado y convertido a AudioData como multiple_speakers.
Este ejercicio forma parte del curso
Procesamiento del lenguaje hablado en Python
Instrucciones del ejercicio
- Crea una instancia de
Recognizer. - Reconoce la variable
multiple_speakersusando la funciónrecognize_google(). - Establece el idioma a inglés de EE. UU. (
"en-US").
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a recognizer class
recognizer = sr.____()
# Recognize the multiple speaker AudioData
text = recognizer.recognize_google(____,
language=____)
# Print the text
print(text)