Mehrere Sprecher/innen 1
Wenn du Gespräche transkribieren willst, gibt es mehr als eine sprechende Person. Wie du gleich siehst, transkribiert die Funktion recognize_google() Sprache jedoch nur in einem einzigen Textblock.
In dieser Audiodatei hörst du drei verschiedene Sprecher/innen.
Wenn du sie jedoch direkt transkribierst, liefert recognize_google() einen einzelnen Textblock. Das ist immer noch nützlich, aber du erfährst nicht, wer was gesagt hat.
Eine Alternative dazu schauen wir uns in der nächsten Übung an.
Die Audiodatei mit mehreren Sprecher/innen wurde importiert und als AudioData in multiple_speakers konvertiert.
Diese Übung ist Teil des Kurses
Verarbeitung gesprochener Sprache in Python
Anleitung zur Übung
- Erstelle eine Instanz von
Recognizer. - Erkenne die Variable
multiple_speakersmit der Funktionrecognize_google(). - Setze die Sprache auf US-Englisch (
"en-US").
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a recognizer class
recognizer = sr.____()
# Recognize the multiple speaker AudioData
text = recognizer.recognize_google(____,
language=____)
# Print the text
print(text)