1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình đa phương thức với Hugging Face

Connected

Bài tập

Khử nhiễu âm thanh

Trong bài tập này, bạn sẽ dùng dữ liệu từ bộ WHAM, nơi trộn lời nói với tiếng ồn nền, để tạo ra lời nói mới bằng một giọng khác và đã loại bỏ tiếng ồn nền!

Spectrogram of noisy speech

Mảng example_speech và vector speaker_embedding của giọng nói mới đã được nạp sẵn. Bộ tiền xử lý (processor) và vocoder (vocoder) cũng đã sẵn sàng, cùng với mô-đun SpeechT5ForSpeechToSpeech. Hàm make_spectrogram() được cung cấp để hỗ trợ vẽ biểu đồ.

Hướng dẫn

100 XP
  • Tải mô hình pretrained SpeechT5ForSpeechToSpeech với checkpoint microsoft/speecht5_vc.
  • Tiền xử lý example_speech với tần số lấy mẫu 16000.
  • Tạo lời nói đã khử nhiễu bằng .generate_speech().