Aan de slagGa gratis aan de slag

Meerdere sprekers 1

Als je gesprekken wilt transcriberen, heb je te maken met meer dan één spreker. Maar zoals je zult zien, zet de functie recognize_google() alle spraak om naar één blok tekst.

In dit audiobestand hoor je drie verschillende sprekers.

Als je het los transcribeert, geeft recognize_google() echter één blok tekst terug. Dat is nog steeds nuttig, maar je ziet dan niet welke spreker wat heeft gezegd.

In de volgende oefening bekijken we een alternatief hiervoor.

Het audiobestand met meerdere sprekers is geïmporteerd en geconverteerd naar AudioData als multiple_speakers.

Deze oefening maakt deel uit van de cursus

Spoken Language Processing in Python

Cursus bekijken

Oefeninstructies

  • Maak een instantie van Recognizer.
  • Herken de variabele multiple_speakers met de functie recognize_google().
  • Stel de taal in op Amerikaans Engels ("en-US").

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a recognizer class
recognizer = sr.____()

# Recognize the multiple speaker AudioData
text = recognizer.recognize_google(____, 
                       			   language=____)

# Print the text
print(text)
Code bewerken en uitvoeren