ComenzarEmpieza gratis

De AudioFile a AudioData

Como viste antes, hay algunos pasos de transformación que tenemos que aplicar para que nuestros datos de audio sean útiles. Con SpeechRecognition pasa lo mismo.

En este ejercicio, importaremos el archivo de audio clean_support_call.wav y lo prepararemos para el reconocimiento.

Primero leemos nuestro archivo de audio con la clase AudioFile. Pero el método recognize_google() requiere una entrada de tipo AudioData.

Para convertir nuestro AudioFile en AudioData, usaremos el método record() de la clase Recognizer junto con un gestor de contexto. El método record() toma un AudioFile como entrada y lo convierte en AudioData, listo para usar con recognize_google().

SpeechRecognition ya se ha importado como sr.

Este ejercicio forma parte del curso

Procesamiento del lenguaje hablado en Python

Ver curso

Instrucciones del ejercicio

  • Pasa la clase AudioFile el archivo clean_support_call.wav.
  • Usa el gestor de contexto para abrir y leer clean_support_call como source.
  • Graba source y ejecuta el código.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Instantiate Recognizer
recognizer = sr.Recognizer()

# Convert audio to AudioFile
clean_support_call = sr.AudioFile(____)

# Convert AudioFile to AudioData
with ____ as source:
    clean_support_call_audio = recognizer.record(____)

# Transcribe AudioData to text
text = recognizer.recognize_google(clean_support_call_audio,
                                   language="en-US")
print(text)
Editar y ejecutar código