1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 음성 언어 처리

Connected

연습 문제

PyDub으로 오디오 파일 정규화하기

어떤 오디오 파일은 구간에 따라 말소리가 크다가 작아지기도 해요. 이런 볼륨 차이는 음성 전사 정확도를 떨어뜨릴 수 있어요.

다행히 PyDub의 effects 모듈에는 normalize()라는 함수가 있어요. 이 함수는 AudioSegment의 최대 볼륨을 찾은 뒤, 나머지 구간의 볼륨을 그에 맞춰 비례하도록 조정해 줍니다. 즉, 작은 소리 구간의 볼륨이 보정돼 더 또렷하게 들리게 돼요.

처음에는 크다가 점점 작아지는 예시 오디오 파일 loud_then_quiet.wav는 여기에서 들어볼 수 있어요.

이번 연습에서는 normalize()를 사용해 파일의 볼륨을 정규화하여, 이런 느낌에 가깝게 만들 거예요.

지침

100 XP
  • PyDub에서 AudioSegment를, PyDub의 effects 모듈에서 normalize를 임포트하세요.
  • 대상 오디오 파일 loud_then_quiet.wav를 임포트해 loud_then_quiet로 저장하세요.
  • normalize() 함수를 사용해 임포트한 오디오 파일을 정규화하고 normalized_loud_then_quiet로 저장하세요.