Grabando el audio que necesitamos

A veces puede que no te interese todo el archivo de audio con el que estás trabajando. Los parámetros duration y offset del método record() pueden ayudarte con esto.

Tras explorar tu conjunto de datos, encuentras un archivo, importado como nothing_at_end, que tiene 30 segundos de silencio al final, y un archivo de una llamada de soporte, importado como out_of_warranty, que tiene 3 segundos de estática al principio.

Configurar duration y offset significa que el método record() registrará hasta duration de audio empezando en offset. Ambos se miden en segundos.

Este ejercicio forma parte del curso

Procesamiento del lenguaje hablado en Python

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Convert AudioFile to AudioData
with nothing_at_end as source:
    nothing_at_end_audio = recognizer.record(source,
                                             duration=____,
                                             offset=None)

# Transcribe AudioData to text
text = recognizer.recognize_google(nothing_at_end_audio,
                                   language="en-US")

print(text)

Editar y ejecutar código