Mehrere Sprecher/innen 1
Wenn du Gespräche transkribieren willst, gibt es mehr als eine sprechende Person. Wie du gleich siehst, transkribiert die Funktion recognize_google() Sprache jedoch nur in einem einzigen Textblock.
In dieser Audiodatei hörst du drei verschiedene Sprecher/innen.
Wenn du sie jedoch direkt transkribierst, liefert recognize_google() einen einzelnen Textblock. Das ist immer noch nützlich, aber du erfährst nicht, wer was gesagt hat.
Eine Alternative dazu schauen wir uns in der nächsten Übung an.
Die Audiodatei mit mehreren Sprecher/innen wurde importiert und als AudioData in multiple_speakers konvertiert.
Diese Übung ist Teil des Kurses
<Kurs>Verarbeitung gesprochener Sprache in Python</Kurs>Übungsanweisungen
- Erstelle eine Instanz von
Recognizer. - Erkenne die Variable
multiple_speakersmit der Funktionrecognize_google(). - Setze die Sprache auf US-Englisch (
"en-US").
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a recognizer class
recognizer = sr.____()
# Recognize the multiple speaker AudioData
text = recognizer.recognize_google(____,
language=____)
# Print the text
print(text)