Normalizar un archivo de audio con PyDub
A veces tendrás archivos de audio donde la voz suena alta en algunas partes y baja en otras. Esta variación de volumen puede dificultar la transcripción.
Por suerte, el módulo de efectos de PyDub tiene una función llamada normalize() que encuentra el volumen máximo de un AudioSegment y ajusta el resto del AudioSegment en proporción. Esto significa que las partes más silenciosas se amplificarán.
Puedes escuchar un ejemplo de un archivo de audio que empieza alto y luego baja, loud_then_quiet.wav, aquí.
En este ejercicio, usarás normalize() para normalizar el volumen de nuestro archivo, haciendo que suene más parecido a esto.
Este ejercicio forma parte del curso
Procesamiento del lenguaje hablado en Python
Instrucciones del ejercicio
- Importa
AudioSegmentdePyDubynormalizedel módulo de efectos dePyDub. - Importa el archivo de audio objetivo,
loud_then_quiet.wav, y guárdalo enloud_then_quiet. - Normaliza el archivo de audio importado usando la función
normalize()y guárdalo ennormalized_loud_then_quiet.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import AudioSegment and normalize
from pydub import ____
from pydub.effects import ____
# Import target audio file
loud_then_quiet = AudioSegment.from_file(____)
# Normalize target audio file
normalized_loud_then_quiet = ____(____)