Audio-Dateien zuschneiden und zusammenführen
Einige deiner Audiodateien enthalten vielleicht redundante Abschnitte. Zum Beispiel findest du am Anfang jeder Datei ein paar Sekunden Rauschen.
Anstatt Rechenleistung dafür zu verschwenden, dieses Rauschen zu transkribieren, kannst du es entfernen.
Da ein AudioSegment iterierbar ist und in Millisekunden gemessen wird, kannst du mit Slicing die Länge verändern.
Um die ersten 3 Sekunden von wav_file zu erhalten, würdest du wav_file[:3000] verwenden.
Du kannst auch zwei AudioSegment-Objekte mit dem Additionsoperator zusammenfügen. Das ist hilfreich, wenn du mehrere Audiodateien kombinieren musst.
Um beides zu üben, entfernen wir die ersten vier Sekunden von part1.wav und fügen den Rest an part2.wav an. Das Endergebnis soll dann wie part_3.wav klingen.
Diese Übung ist Teil des Kurses
Verarbeitung gesprochener Sprache in Python
Anleitung zur Übung
- Importiere
part_1.wavundpart_2.wavund speichere sie jeweils inpart_1bzw.part_2. - Entferne die ersten 4 Sekunden von
part_1mit Slicing und speichere das neue Audio inpart_1_removed. - Füge
part_1_removedzupart_2hinzu und speichere das Ergebnis inpart_3.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
from pydub import AudioSegment
# Import part 1 and part 2 audio files
part_1 = AudioSegment.from_file(____)
part_2 = ____.____(____)
# Remove the first four seconds of part 1
part_1_removed = part_1[____:]
# Add the remainder of part 1 and part 2 together
part_3 = ____ + ____