Enregistrer uniquement l’audio nécessaire
Parfois, vous n’avez pas besoin de tout le fichier audio sur lequel vous travaillez. Les paramètres duration et offset de la méthode record() peuvent vous aider.
Après avoir exploré votre jeu de données, vous constatez qu’un fichier, importé sous le nom nothing_at_end, comporte 30 secondes de silence à la fin et qu’un fichier d’appel au support, importé sous le nom out_of_warranty, présente 3 secondes de parasite au début.
Définir duration et offset signifie que la méthode record() enregistrera jusqu’à duration d’audio en commençant à offset. Les deux sont mesurés en secondes.
Cet exercice fait partie du cours
Traitement du langage parlé en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Convert AudioFile to AudioData
with nothing_at_end as source:
nothing_at_end_audio = recognizer.record(source,
duration=____,
offset=None)
# Transcribe AudioData to text
text = recognizer.recognize_google(nothing_at_end_audio,
language="en-US")
print(text)