Plusieurs locuteurs 1
Si votre objectif est de transcrire des conversations, il y aura plus d’un locuteur. Cependant, comme vous allez le voir, la fonction recognize_google() ne produit qu’un seul bloc de texte.
Vous pouvez entendre dans cet extrait audio qu’il y a trois locuteurs différents.
Mais si vous le transcrivez tel quel, recognize_google() renvoie un seul bloc de texte. C’est utile, mais cela ne vous indique pas quel locuteur a dit quoi.
Nous verrons une alternative à cela dans l’Exercice suivant.
Le fichier audio avec plusieurs locuteurs a été importé et converti en AudioData sous le nom multiple_speakers.
Cet exercice fait partie du cours
Traitement du langage parlé en Python
Instructions
- Créez une instance de
Recognizer. - Transcrivez la variable
multiple_speakersà l’aide de la fonctionrecognize_google(). - Définissez la langue sur l’anglais américain (
"en-US").
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a recognizer class
recognizer = sr.____()
# Recognize the multiple speaker AudioData
text = recognizer.recognize_google(____,
language=____)
# Print the text
print(text)