LoslegenKostenlos loslegen

Audioparameter mit PyDub

Jede Audiodatei, mit der du arbeitest, hat eine Reihe von Eigenschaften, zum Beispiel Kanäle, Frame-Rate (oder Sample-Rate), Sample-Breite und mehr.

Diese Parameter zu kennen, hilft dir sicherzustellen, dass deine Audiodateien mit den Anforderungen verschiedener APIs für Spracherkennung kompatibel sind.

Viele APIs empfehlen zum Beispiel eine minimale Frame-Rate (wav_file.frame_rate) von 16.000 Hz.

Wenn du eine Instanz von AudioSegment erstellst, leitet PyDub diese Parameter automatisch aus deinen Audiodateien ab und speichert sie als Attribute.

In dieser Übung schauen wir uns diese Attribute an.

Diese Übung ist Teil des Kurses

Verarbeitung gesprochener Sprache in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import audio file
wav_file = AudioSegment.from_file(file="wav_file.wav")

# Find the frame rate
print(wav_file.____)
Code bearbeiten und ausführen