Transcrire de l’audio en une ligne
Très bien, maintenant que vous avez des fonctions pour convertir des fichiers audio et en obtenir les attributs, il est temps d’en créer une pour les transcrire.
Dans cet exercice, vous allez créer transcribe_audio() qui prend un filename en entrée, importe ce filename à l’aide de la classe AudioFile de speech_recognition, puis le transcrit avec recognize_google().
Vous avez déjà vu ces fonctions, mais nous allons maintenant les combiner afin qu’elles soient accessibles via une fonction.
Pour tester, nous allons transcrire le premier appel d’Acme, "call_1.wav".
speech_recognition a été importé sous le nom sr.
Cet exercice fait partie du cours
Traitement du langage parlé en Python
Instructions
- Définissez une fonction appelée
transcribe_audioqui prendfilenamecomme paramètre d’entrée. - Instanciez un
Recognizer()et affectez-le àrecognizer. - Utilisez
recognize_google()pour transcrire les données audio. - Passez l’appel cible à la fonction.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
____ ____(____):
"""Takes a .wav format audio file and transcribes it to text."""
# Setup a recognizer instance
____ = sr.Recognizer()
# Import the audio file and convert to audio data
audio_file = sr.AudioFile(filename)
with audio_file as source:
audio_data = recognizer.record(source)
# Return the transcribed text
return recognizer.____(audio_data)
# Test the function
print(transcribe_audio(____))