Paramètres audio avec PyDub

Chaque fichier audio avec lequel vous travaillez possède plusieurs caractéristiques : nombre de canaux, fréquence d’images (ou fréquence d’échantillonnage), largeur d’échantillon, etc.

Connaître ces paramètres vous aide à vérifier la compatibilité de vos fichiers audio avec les exigences des différentes API de transcription vocale.

Par exemple, de nombreuses API recommandent une fréquence d’images minimale (wav_file.frame_rate) de 16 000 Hz.

Quand vous créez une instance d’AudioSegment, PyDub déduit automatiquement ces paramètres à partir de vos fichiers audio et les enregistre comme attributs.

Dans cet exercice, nous allons explorer ces attributs.

Cet exercice fait partie du cours

<cours>Traitement du langage parlé en Python</cours>

Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import audio file
wav_file = AudioSegment.from_file(file="wav_file.wav")

# Find the frame rate
print(wav_file.____)

Modifier et exécuter le code