1. 学ぶ
  2. /
  3. コース
  4. /
  5. Mô hình đa phương thức với Hugging Face

Connected

演習

Tạo giọng nói mới

Đến lúc hoàn thiện kỹ năng dùng các mô hình âm thanh của Hugging Face! Bạn sẽ dùng một mô hình đã fine-tune để tạo giọng nói mới dựa trên một giọng có sẵn. Bạn sẽ chọn một giọng từ VCTK Corpus làm nền cho âm thanh mới.

dataset và mô hình SpeechT5ForTextToSpeech (model) đã được nạp sẵn, và một hàm make_spectogram() đã được cung cấp để hỗ trợ việc vẽ biểu đồ.

指示

100 XP
  • Tải một embedding người nói mẫu từ chỉ mục 5 của dataset phần test.
  • Sinh giọng nói từ văn bản đã xử lý bằng cách chỉ định inputs, speaker_embedding và vocoder.