Paramètres audio avec PyDub
Chaque fichier audio avec lequel vous travaillez possède plusieurs caractéristiques : nombre de canaux, fréquence d’images (ou fréquence d’échantillonnage), largeur d’échantillon, etc.
Connaître ces paramètres vous aide à vérifier la compatibilité de vos fichiers audio avec les exigences des différentes API de transcription vocale.
Par exemple, de nombreuses API recommandent une fréquence d’images minimale (wav_file.frame_rate) de 16 000 Hz.
Quand vous créez une instance d’AudioSegment, PyDub déduit automatiquement ces paramètres à partir de vos fichiers audio et les enregistre comme attributs.
Dans cet exercice, nous allons explorer ces attributs.
Cet exercice fait partie du cours
Traitement du langage parlé en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import audio file
wav_file = AudioSegment.from_file(file="wav_file.wav")
# Find the frame rate
print(wav_file.____)