Arbeiten mit verrauschtem Audio
In dieser Übung transkribieren wir zuerst eine saubere Sprachaufnahme zu Text und schauen uns dann an, was passiert, wenn wir Hintergrundgeräusche hinzufügen.
Eine saubere Audioaufnahme wurde als clean_support_call importiert.
Danach machen wir dasselbe mit der verrauschten Audiodatei noisy_support_call. Sie enthält die gleiche Sprache wie clean_support_call, aber mit zusätzlichem Hintergrundrauschen.
Um das Hintergrundrauschen zu kompensieren, nutzen wir die Funktion adjust_for_ambient_noise() von Recognizer.
Diese Übung ist Teil des Kurses
Verarbeitung gesprochener Sprache in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
recognizer = sr.Recognizer()
# Record the audio from the clean support call
with ____ as source:
clean_support_call_audio = ____.record(____)
# Transcribe the speech from the clean support call
text = recognizer.____(____,
language="en-US")
print(text)