ComenzarEmpieza gratis

Normalizar un archivo de audio con PyDub

A veces tendrás archivos de audio donde la voz suena alta en algunas partes y baja en otras. Esta variación de volumen puede dificultar la transcripción.

Por suerte, el módulo de efectos de PyDub tiene una función llamada normalize() que encuentra el volumen máximo de un AudioSegment y ajusta el resto del AudioSegment en proporción. Esto significa que las partes más silenciosas se amplificarán.

Puedes escuchar un ejemplo de un archivo de audio que empieza alto y luego baja, loud_then_quiet.wav, aquí.

En este ejercicio, usarás normalize() para normalizar el volumen de nuestro archivo, haciendo que suene más parecido a esto.

Este ejercicio forma parte del curso

Procesamiento del lenguaje hablado en Python

Ver curso

Instrucciones del ejercicio

  • Importa AudioSegment de PyDub y normalize del módulo de efectos de PyDub.
  • Importa el archivo de audio objetivo, loud_then_quiet.wav, y guárdalo en loud_then_quiet.
  • Normaliza el archivo de audio importado usando la función normalize() y guárdalo en normalized_loud_then_quiet.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import AudioSegment and normalize
from pydub import ____
from pydub.effects import ____

# Import target audio file
loud_then_quiet = AudioSegment.from_file(____)

# Normalize target audio file
normalized_loud_then_quiet = ____(____)
Editar y ejecutar código