Ein Workflow zur Audiobearbeitung

Du hast gesehen, wie du mit PyDub eine einzelne Audiodatei importierst und bearbeitest. Aber was, wenn du einen Ordner mit mehreren Audiodateien hast, die du konvertieren musst?

In dieser Übung verwenden wir PyDub, um einen Ordner mit Dateien so zu formatieren, dass sie mit speech_recognition verwendet werden können.

Du hast festgestellt, dass deine Kundenanrufe alle 3 Sekunden Rauschen am Anfang haben und leiser sind, als sie sein könnten.

Um das zu beheben, nutzen wir PyDub, um das Rauschen abzuschneiden, die Lautstärke zu erhöhen und sie in die Endung .wav zu konvertieren.

Ein unformatiertes Beispiel kannst du dir hier anhören.

Diese Übung ist Teil des Kurses

Verarbeitung gesprochener Sprache in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

file_with_static = AudioSegment.from_file(____)

# Cut the first 3-seconds of static off
file_without_static = file_with_static[____:]

Code bearbeiten und ausführen