Meerdere sprekers 1
Als je gesprekken wilt transcriberen, heb je te maken met meer dan één spreker. Maar zoals je zult zien, zet de functie recognize_google() alle spraak om naar één blok tekst.
In dit audiobestand hoor je drie verschillende sprekers.
Als je het los transcribeert, geeft recognize_google() echter één blok tekst terug. Dat is nog steeds nuttig, maar je ziet dan niet welke spreker wat heeft gezegd.
In de volgende oefening bekijken we een alternatief hiervoor.
Het audiobestand met meerdere sprekers is geïmporteerd en geconverteerd naar AudioData als multiple_speakers.
Deze oefening maakt deel uit van de cursus
Spoken Language Processing in Python
Oefeninstructies
- Maak een instantie van
Recognizer. - Herken de variabele
multiple_speakersmet de functierecognize_google(). - Stel de taal in op Amerikaans Engels (
"en-US").
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a recognizer class
recognizer = sr.____()
# Recognize the multiple speaker AudioData
text = recognizer.recognize_google(____,
language=____)
# Print the text
print(text)