CommencerCommencer gratuitement

Transcrire de l’audio en une ligne

Très bien, maintenant que vous avez des fonctions pour convertir des fichiers audio et en obtenir les attributs, il est temps d’en créer une pour les transcrire.

Dans cet exercice, vous allez créer transcribe_audio() qui prend un filename en entrée, importe ce filename à l’aide de la classe AudioFile de speech_recognition, puis le transcrit avec recognize_google().

Vous avez déjà vu ces fonctions, mais nous allons maintenant les combiner afin qu’elles soient accessibles via une fonction.

Pour tester, nous allons transcrire le premier appel d’Acme, "call_1.wav".

speech_recognition a été importé sous le nom sr.

Cet exercice fait partie du cours

Traitement du langage parlé en Python

Afficher le cours

Instructions

  • Définissez une fonction appelée transcribe_audio qui prend filename comme paramètre d’entrée.
  • Instanciez un Recognizer() et affectez-le à recognizer.
  • Utilisez recognize_google() pour transcrire les données audio.
  • Passez l’appel cible à la fonction.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

____ ____(____):
  """Takes a .wav format audio file and transcribes it to text."""
  # Setup a recognizer instance
  ____ = sr.Recognizer()
  
  # Import the audio file and convert to audio data
  audio_file = sr.AudioFile(filename)
  with audio_file as source:
    audio_data = recognizer.record(source)
  
  # Return the transcribed text
  return recognizer.____(audio_data)

# Test the function
print(transcribe_audio(____))
Modifier et exécuter le code