ComenzarEmpieza gratis

Un flujo de trabajo de procesamiento de audio

Ya has visto cómo importar y manipular un único archivo de audio con PyDub. Pero ¿y si tuvieras una carpeta con varios archivos que necesitas convertir?

En este ejercicio usaremos PyDub para dar formato a una carpeta de archivos y dejarlos listos para usar con speech_recognition.

Has descubierto que tus grabaciones de llamadas de clientes tienen 3 segundos de estática al inicio y suenan más bajas de lo deseado.

Para solucionarlo, usaremos PyDub para recortar la estática, subir el nivel de sonido y convertirlos a la extensión .wav.

Puedes escuchar un ejemplo sin formatear aquí.

Este ejercicio forma parte del curso

Procesamiento del lenguaje hablado en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

file_with_static = AudioSegment.from_file(____)

# Cut the first 3-seconds of static off
file_without_static = file_with_static[____:]
Editar y ejecutar código