Normaliser un fichier audio avec PyDub

Il arrive que certains fichiers audio aient des passages où la voix est forte, puis d’autres où elle est très faible. Cette variation de volume peut gêner la transcription.

Heureusement, le module d’effets de PyDub propose une fonction appelée normalize() qui détecte le volume maximal d’un AudioSegment, puis ajuste le reste de l’AudioSegment en proportion. Autrement dit, les parties silencieuses gagnent en volume.

Vous pouvez écouter un exemple de fichier audio qui commence fort puis devient plus faible, loud_then_quiet.wav, ici.

Dans cet exercice, vous allez utiliser normalize() pour homogénéiser le volume de notre fichier, afin qu’il sonne plutôt comme ceci.

Cet exercice fait partie du cours

<cours>Traitement du langage parlé en Python</cours>

Voir le cours

Instructions de l’exercice

Importez AudioSegment depuis PyDub et normalize depuis le module d’effets de PyDub.
Importez le fichier audio cible, loud_then_quiet.wav, et enregistrez-le dans loud_then_quiet.
Normalisez le fichier audio importé avec la fonction normalize() et enregistrez le résultat dans normalized_loud_then_quiet.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import AudioSegment and normalize
from pydub import ____
from pydub.effects import ____

# Import target audio file
loud_then_quiet = AudioSegment.from_file(____)

# Normalize target audio file
normalized_loud_then_quiet = ____(____)

Modifier et exécuter le code