Parámetros de audio con PyDub

Cada archivo de audio con el que trabajes tiene varias características asociadas, como los canales, la frecuencia de fotogramas (o frecuencia de muestreo), el ancho de muestra y más.

Conocer estos parámetros te ayuda a asegurarte de que tus archivos de audio sean compatibles con los requisitos de distintas API para la transcripción de voz.

Por ejemplo, muchas API recomiendan una frecuencia mínima (wav_file.frame_rate) de 16.000 Hz.

Cuando creas una instancia de AudioSegment, PyDub infiere automáticamente estos parámetros de tus archivos de audio y los guarda como atributos.

En este ejercicio, vamos a explorar estos atributos.

Este ejercicio forma parte del curso

Procesamiento del lenguaje hablado en Python

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Import audio file
wav_file = AudioSegment.from_file(file="wav_file.wav")

# Find the frame rate
print(wav_file.____)

Editar y ejecutar código