1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie mowy w Pythonie

Connected

ćwiczenie

Parametry audio w PyDub

Każdy plik audio ma przypisany zestaw właściwości, takich jak liczba kanałów, częstotliwość próbkowania (frame rate), szerokość próbki i inne.

Znajomość tych parametrów pozwala upewnić się, że pliki audio są zgodne z wymaganiami różnych API do transkrypcji mowy.

Na przykład wiele API zaleca minimalną częstotliwość próbkowania (wav_file.frame_rate) wynoszącą 16 000 Hz.

Podczas tworzenia instancji AudioSegment biblioteka PyDub automatycznie odczytuje te parametry z pliku audio i zapisuje je jako atrybuty.

W tym ćwiczeniu przyjrzymy się bliżej tym atrybutom.

Instrukcje 1/4

undefined XP
  • 1
    • Znajdź frame_rate pliku wav_file.
  • 2
    • Znajdź liczbę kanałów pliku wav_file.
  • 3
    • Znajdź maksymalną amplitudę pliku wav_file.
  • 4
    • Znajdź długość pliku wav_file w milisekundach.