LoslegenKostenlos loslegen

Die Recognizer-Klasse verwenden

Jetzt, da du eine Instanz der Klasse Recognizer erstellt hast, verwenden wir darauf die Methode recognize_google(), um auf die Google Web Speech API zuzugreifen und gesprochene Sprache in Text umzuwandeln.

recognize_google() benötigt das Argument audio_data, sonst wird ein Fehler zurückgegeben.

US-Englisch ist die Standardsprache. Wenn deine Audiodatei nicht in US-Englisch ist, kannst du die Sprache mit dem Argument language ändern. Eine Liste der Sprachcodes findest du hier.

Eine Audiodatei mit englischer Sprache wurde als clean_support_call_audio importiert. Du kannst die Audiodatei hier anhören. SpeechRecognition wurde außerdem als sr importiert.

Um das Anfragelimit der Google Web API nicht zu überschreiten, haben wir die Klasse Recognizer für unsere Audiodateien nachgebildet (gemockt). Das bedeutet, dass manche Funktionen eingeschränkt sind.

Diese Übung ist Teil des Kurses

Verarbeitung gesprochener Sprache in Python

Kurs anzeigen

Anleitung zur Übung

  • Rufe die Methode recognize_google() auf recognizer auf und übergib clean_support_call_audio.
  • Setze das Argument language auf "en-US".

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a recognizer class
recognizer = sr.Recognizer()

# Transcribe the support call audio
text = ____.____(
  audio_data=____, 
  language=____)

print(text)
Code bearbeiten und ausführen