Audio-Dateien zuschneiden und zusammenführen

Einige deiner Audiodateien enthalten vielleicht redundante Abschnitte. Zum Beispiel findest du am Anfang jeder Datei ein paar Sekunden Rauschen.

Anstatt Rechenleistung dafür zu verschwenden, dieses Rauschen zu transkribieren, kannst du es entfernen.

Da ein AudioSegment iterierbar ist und in Millisekunden gemessen wird, kannst du mit Slicing die Länge verändern.

Um die ersten 3 Sekunden von wav_file zu erhalten, würdest du wav_file[:3000] verwenden.

Du kannst auch zwei AudioSegment-Objekte mit dem Additionsoperator zusammenfügen. Das ist hilfreich, wenn du mehrere Audiodateien kombinieren musst.

Um beides zu üben, entfernen wir die ersten vier Sekunden von part1.wav und fügen den Rest an part2.wav an. Das Endergebnis soll dann wie part_3.wav klingen.

Diese Übung ist Teil des Kurses

<Kurs>Verarbeitung gesprochener Sprache in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Importiere part_1.wav und part_2.wav und speichere sie jeweils in part_1 bzw. part_2.
Entferne die ersten 4 Sekunden von part_1 mit Slicing und speichere das neue Audio in part_1_removed.
Füge part_1_removed zu part_2 hinzu und speichere das Ergebnis in part_3.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

from pydub import AudioSegment

# Import part 1 and part 2 audio files
part_1 = AudioSegment.from_file(____)
part_2 = ____.____(____)

# Remove the first four seconds of part 1
part_1_removed = part_1[____:]

# Add the remainder of part 1 and part 2 together
part_3 = ____ + ____

Code bearbeiten und ausführen