LoslegenKostenlos loslegen

Mehrere Sprecher/innen 1

Wenn du Gespräche transkribieren willst, gibt es mehr als eine sprechende Person. Wie du gleich siehst, transkribiert die Funktion recognize_google() Sprache jedoch nur in einem einzigen Textblock.

In dieser Audiodatei hörst du drei verschiedene Sprecher/innen.

Wenn du sie jedoch direkt transkribierst, liefert recognize_google() einen einzelnen Textblock. Das ist immer noch nützlich, aber du erfährst nicht, wer was gesagt hat.

Eine Alternative dazu schauen wir uns in der nächsten Übung an.

Die Audiodatei mit mehreren Sprecher/innen wurde importiert und als AudioData in multiple_speakers konvertiert.

Diese Übung ist Teil des Kurses

Verarbeitung gesprochener Sprache in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Instanz von Recognizer.
  • Erkenne die Variable multiple_speakers mit der Funktion recognize_google().
  • Setze die Sprache auf US-Englisch ("en-US").

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a recognizer class
recognizer = sr.____()

# Recognize the multiple speaker AudioData
text = recognizer.recognize_google(____, 
                       			   language=____)

# Print the text
print(text)
Code bearbeiten und ausführen