음성 임베딩 만들기

이제 오디오 배열을 화자 임베딩으로 인코딩해 볼까요? 화자 임베딩에는 특정 화자에 맞춰 생성 오디오를 개인화하는 데 필요한 정보가 들어 있으며, 미세 조정된 오디오를 생성하는 데 필수적입니다.

사전 학습된 spkrec-xvect-voxceleb 모델(speaker_model)과 VCTK 데이터셋(dataset)이 미리 로드되어 있습니다.