Die benötigte Audiospur aufnehmen

Manchmal brauchst du nicht die gesamte Audiodatei, mit der du arbeitest. Die Parameter duration und offset der Methode record() helfen dir dabei.

Beim Erkunden deines Datensatzes stellst du fest: Es gibt eine Datei, importiert als nothing_at_end, die 30 Sekunden Stille am Ende hat, und eine Support-Call-Datei, importiert als out_of_warranty, die 3 Sekunden Rauschen am Anfang hat.

Mit duration und offset legst du fest, dass die Methode record() ab offset bis zu duration Sekunden Audio aufnimmt. Beide werden in Sekunden gemessen.

Diese Übung ist Teil des Kurses

<Kurs>Verarbeitung gesprochener Sprache in Python</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Convert AudioFile to AudioData
with nothing_at_end as source:
    nothing_at_end_audio = recognizer.record(source,
                                             duration=____,
                                             offset=None)

# Transcribe AudioData to text
text = recognizer.recognize_google(nothing_at_end_audio,
                                   language="en-US")

print(text)

Code bearbeiten und ausführen