Arbeiten mit verrauschtem Audio
In dieser Übung transkribieren wir zuerst eine saubere Sprachaufnahme zu Text und schauen uns dann an, was passiert, wenn wir Hintergrundgeräusche hinzufügen.
Eine saubere Audioaufnahme wurde als clean_support_call importiert.
Danach machen wir dasselbe mit der verrauschten Audiodatei noisy_support_call. Sie enthält die gleiche Sprache wie clean_support_call, aber mit zusätzlichem Hintergrundrauschen.
Um das Hintergrundrauschen zu kompensieren, nutzen wir die Funktion adjust_for_ambient_noise() von Recognizer.
Diese Übung ist Teil des Kurses
<Kurs>Verarbeitung gesprochener Sprache in Python</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
recognizer = sr.Recognizer()
# Record the audio from the clean support call
with ____ as source:
clean_support_call_audio = ____.record(____)
# Transcribe the speech from the clean support call
text = recognizer.____(____,
language="en-US")
print(text)