Von AudioFile zu AudioData

Wie du vorhin gesehen hast, müssen wir ein paar Verarbeitungsschritte durchführen, damit unsere Audiodaten nützlich werden. Das gilt auch für SpeechRecognition.

In dieser Übung importieren wir die Audiodatei clean_support_call.wav und machen sie bereit für die Erkennung.

Zuerst lesen wir unsere Audiodatei mit der Klasse AudioFile ein. Die Methode recognize_google() erwartet jedoch eine Eingabe vom Typ AudioData.

Um unser AudioFile in AudioData zu konvertieren, verwenden wir die Methode record() der Klasse Recognizer zusammen mit einem Context Manager. Die Methode record() nimmt ein AudioFile als Eingabe und wandelt es in AudioData um, das dann mit recognize_google() verwendet werden kann.

SpeechRecognition wurde bereits als sr importiert.

Diese Übung ist Teil des Kurses

Verarbeitung gesprochener Sprache in Python

Kurs anzeigen

Anleitung zur Übung

Übergebe der Klasse AudioFile clean_support_call.wav.
Verwende den Context Manager, um clean_support_call als source zu öffnen und zu lesen.
Nimm source auf und führe den Code aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Instantiate Recognizer
recognizer = sr.Recognizer()

# Convert audio to AudioFile
clean_support_call = sr.AudioFile(____)

# Convert AudioFile to AudioData
with ____ as source:
    clean_support_call_audio = recognizer.record(____)

# Transcribe AudioData to text
text = recognizer.recognize_google(clean_support_call_audio,
                                   language="en-US")
print(text)

Code bearbeiten und ausführen