Arbeiten mit verrauschtem Audio

In dieser Übung transkribieren wir zuerst eine saubere Sprachaufnahme zu Text und schauen uns dann an, was passiert, wenn wir Hintergrundgeräusche hinzufügen.

Eine saubere Audioaufnahme wurde als clean_support_call importiert.

Play clean support call.

Danach machen wir dasselbe mit der verrauschten Audiodatei noisy_support_call. Sie enthält die gleiche Sprache wie clean_support_call, aber mit zusätzlichem Hintergrundrauschen.

Play noisy support call.

Um das Hintergrundrauschen zu kompensieren, nutzen wir die Funktion adjust_for_ambient_noise() von Recognizer.

Diese Übung ist Teil des Kurses

<Kurs>Verarbeitung gesprochener Sprache in Python</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

recognizer = sr.Recognizer()

# Record the audio from the clean support call
with ____ as source:
  clean_support_call_audio = ____.record(____)

# Transcribe the speech from the clean support call
text = recognizer.____(____,
					   language="en-US")

print(text)

Code bearbeiten und ausführen