Die benötigte Audiospur aufnehmen
Manchmal brauchst du nicht die gesamte Audiodatei, mit der du arbeitest. Die Parameter duration und offset der Methode record() helfen dir dabei.
Beim Erkunden deines Datensatzes stellst du fest: Es gibt eine Datei, importiert als nothing_at_end, die 30 Sekunden Stille am Ende hat, und eine Support-Call-Datei, importiert als out_of_warranty, die 3 Sekunden Rauschen am Anfang hat.
Mit duration und offset legst du fest, dass die Methode record() ab offset bis zu duration Sekunden Audio aufnimmt. Beide werden in Sekunden gemessen.
Diese Übung ist Teil des Kurses
Verarbeitung gesprochener Sprache in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Convert AudioFile to AudioData
with nothing_at_end as source:
nothing_at_end_audio = recognizer.record(source,
duration=____,
offset=None)
# Transcribe AudioData to text
text = recognizer.recognize_google(nothing_at_end_audio,
language="en-US")
print(text)