Un flux de traitement audio

Vous avez vu comment importer et manipuler un seul fichier audio avec PyDub. Mais que faire si vous avez un dossier contenant plusieurs fichiers audio à convertir ?

Dans cet exercice, nous allons utiliser PyDub pour mettre en forme un dossier de fichiers afin qu’ils soient prêts à être utilisés avec speech_recognition.

Vous avez constaté que vos enregistrements d’appels client commencent tous par 3 secondes de bruit statique et qu’ils sont moins forts qu’ils ne pourraient l’être.

Pour corriger cela, nous utiliserons PyDub pour couper le bruit statique, augmenter le niveau sonore et les convertir avec l’extension .wav.

Vous pouvez écouter un exemple non formaté ici.

Cet exercice fait partie du cours

Traitement du langage parlé en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

file_with_static = AudioSegment.from_file(____)

# Cut the first 3-seconds of static off
file_without_static = file_with_static[____:]

Modifier et exécuter le code