1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 음성 언어 처리

Connected

연습 문제

오디오를 올바른 형식으로 변환하기

Acme Studios가 보유한 오디오 파일을 더 잘 파악하기 위해 개념 검증(Proof of Concept)을 진행해 달라고 요청했어요.

간단히 살펴보니 통화 녹음이 몇 개 있지만, 전사에 맞지 않는 파일 형식이네요.

여러 오디오 파일을 다루게 될 것이므로, 우선 보조 함수부터 만들어 보려고 해요.

첫 번째 함수 convert_to_wav(filename)은 파일 경로를 받아 PyDub을 사용해 비-WAV 형식을 .wav 형식으로 변환해요.

함수를 만든 뒤, 이 함수를 사용해 Acme의 첫 번째 통화인 call_1.mp3를 .mp3에서 .wav로 변환해 볼게요.

PyDub의 AudioSegment 클래스는 이미 임포트되어 있어요. 비-WAV 파일을 다루려면 ffmpeg가 필요하다는 점을 기억하세요(docs).

지침

100 XP
  • AudioSegment의 from_file()을 사용해 filename 매개변수를 임포트하세요.
  • 내보내기 형식을 "wav"로 설정하세요.
  • 대상 오디오 파일 call_1.mp3을(를) 함수에 전달하세요.