EmpezarEmpieza gratis

Un flujo de trabajo de procesamiento de audio

Ya has visto cómo importar y manipular un único archivo de audio con PyDub. Pero ¿y si tuvieras una carpeta con varios archivos que necesitas convertir?

En este ejercicio usaremos PyDub para dar formato a una carpeta de archivos y dejarlos listos para usar con speech_recognition.

Has descubierto que tus grabaciones de llamadas de clientes tienen 3 segundos de estática al inicio y suenan más bajas de lo deseado.

Para solucionarlo, usaremos PyDub para recortar la estática, subir el nivel de sonido y convertirlos a la extensión .wav.

Puedes escuchar un ejemplo sin formatear aquí.

Este ejercicio forma parte del curso

Procesamiento del lenguaje hablado en Python

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

file_with_static = AudioSegment.from_file(____)

# Cut the first 3-seconds of static off
file_without_static = file_with_static[____:]
Editar y ejecutar código