1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 음성 언어 처리

Connected

연습 문제

PyDub로 오디오 매개변수 살펴보기

여러분이 다루는 모든 오디오 파일에는 채널 수, 프레임 레이트(또는 샘플 레이트), 샘플 폭 등 다양한 특징이 있습니다.

이러한 매개변수를 알면 음성 전사를 위한 다양한 API 요구 사항과 오디오 파일의 호환성을 확인하는 데 도움이 됩니다.

예를 들어, 많은 API에서 최소 프레임 레이트(wav_file.frame_rate)로 16,000 Hz를 권장합니다.

AudioSegment 인스턴스를 만들면, PyDub이 오디오 파일에서 이 값들을 자동으로 추론해 속성으로 저장합니다.

이번 연습에서는 이러한 속성을 살펴보겠습니다.

지침 1/4

undefined XP
  • 1
    • wav_file의 frame_rate를 확인하세요.
  • 2
    • wav_file의 채널 수를 확인하세요.
  • 3
    • wav_file의 최대 진폭을 확인하세요.
  • 4
    • wav_file의 길이를 밀리초 단위로 확인하세요.