Paramètres audio avec PyDub
Chaque fichier audio avec lequel vous travaillez possède plusieurs caractéristiques : nombre de canaux, fréquence d’images (ou fréquence d’échantillonnage), largeur d’échantillon, etc.
Connaître ces paramètres vous aide à vérifier la compatibilité de vos fichiers audio avec les exigences des différentes API de transcription vocale.
Par exemple, de nombreuses API recommandent une fréquence d’images minimale (wav_file.frame_rate) de 16 000 Hz.
Quand vous créez une instance d’AudioSegment, PyDub déduit automatiquement ces paramètres à partir de vos fichiers audio et les enregistre comme attributs.
Dans cet exercice, nous allons explorer ces attributs.
Cet exercice fait partie du cours
<cours>Traitement du langage parlé en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Import audio file
wav_file = AudioSegment.from_file(file="wav_file.wav")
# Find the frame rate
print(wav_file.____)