다중 화자 2

하나의 오디오 파일에서 여러 화자를 구분하는 작업을 speaker diarization(화자 분리)라고 합니다. 하지만 지금까지 사용한 무료 함수인 recognize_google()은 서로 다른 화자를 구분해 필사할 수는 없었죠.

유료 speech-to-text 서비스를 쓰지 않고 이를 우회하는 한 가지 방법은 오디오 파일을 단일 화자 기준으로 준비하는 것입니다.

예를 들어 통화 데이터를 다룬다면, 발신자와 수신자를 각각 별도로 녹음해 파일을 나누면 됩니다. 그런 다음 각 파일을 개별적으로 필사할 수 있어요.