Normaliser un fichier audio avec PyDub
Il arrive que certains fichiers audio aient des passages où la voix est forte, puis d’autres où elle est très faible. Cette variation de volume peut gêner la transcription.
Heureusement, le module d’effets de PyDub propose une fonction appelée normalize() qui détecte le volume maximal d’un AudioSegment, puis ajuste le reste de l’AudioSegment en proportion. Autrement dit, les parties silencieuses gagnent en volume.
Vous pouvez écouter un exemple de fichier audio qui commence fort puis devient plus faible, loud_then_quiet.wav, ici.
Dans cet exercice, vous allez utiliser normalize() pour homogénéiser le volume de notre fichier, afin qu’il sonne plutôt comme ceci.
Cet exercice fait partie du cours
Traitement du langage parlé en Python
Instructions
- Importez
AudioSegmentdepuisPyDubetnormalizedepuis le module d’effets dePyDub. - Importez le fichier audio cible,
loud_then_quiet.wav, et enregistrez-le dansloud_then_quiet. - Normalisez le fichier audio importé avec la fonction
normalize()et enregistrez le résultat dansnormalized_loud_then_quiet.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import AudioSegment and normalize
from pydub import ____
from pydub.effects import ____
# Import target audio file
loud_then_quiet = AudioSegment.from_file(____)
# Normalize target audio file
normalized_loud_then_quiet = ____(____)