오디오 처리 워크플로

지금까지 PyDub으로 단일 오디오 파일을 가져오고 조작하는 방법을 살펴봤어요. 하지만 변환해야 하는 오디오 파일이 여러 개 들어 있는 폴더가 있다면 어떻게 할까요?

이번 연습에서는 PyDub을 사용해 폴더 안의 파일들을 speech_recognition에서 바로 쓸 수 있는 형식으로 맞춰 보겠습니다.

고객 통화 파일을 확인해 보니, 모두 시작 부분에 3초 동안 잡음이 있고 전체 볼륨도 기대보다 낮네요.

이를 해결하기 위해 PyDub으로 잡음 구간을 잘라 내고, 음량을 높인 뒤, 확장자를 .wav로 변환하겠습니다.

포맷을 적용하지 않은 예시는 여기에서 들어 보실 수 있어요.

하나의 파일로 시작해 봅시다. account_help.mp3를 가져오고, 처음 3초(3000밀리초)의 잡음을 잘라 내세요.

演習