CommencerCommencer gratuitement

Plusieurs locuteurs 1

Si votre objectif est de transcrire des conversations, il y aura plus d’un locuteur. Cependant, comme vous allez le voir, la fonction recognize_google() ne produit qu’un seul bloc de texte.

Vous pouvez entendre dans cet extrait audio qu’il y a trois locuteurs différents.

Mais si vous le transcrivez tel quel, recognize_google() renvoie un seul bloc de texte. C’est utile, mais cela ne vous indique pas quel locuteur a dit quoi.

Nous verrons une alternative à cela dans l’Exercice suivant.

Le fichier audio avec plusieurs locuteurs a été importé et converti en AudioData sous le nom multiple_speakers.

Cet exercice fait partie du cours

Traitement du langage parlé en Python

Afficher le cours

Instructions

  • Créez une instance de Recognizer.
  • Transcrivez la variable multiple_speakers à l’aide de la fonction recognize_google().
  • Définissez la langue sur l’anglais américain ("en-US").

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a recognizer class
recognizer = sr.____()

# Recognize the multiple speaker AudioData
text = recognizer.recognize_google(____, 
                       			   language=____)

# Print the text
print(text)
Modifier et exécuter le code