1. Learn
  2. /
  3. 课程
  4. /
  5. Modele Multi-Modale cu Hugging Face

Connected

道练习

Eliminarea zgomotului din audio

În acest exercițiu, vei folosi date din setul de date WHAM, care combină vorbire cu zgomot de fundal, pentru a genera vorbire nouă într-o altă voce și fără zgomotul de fundal!

Spectrogram of noisy speech

Arrayul example_speech și vectorul speaker_embedding al noii voci au fost deja încărcate. Preprocesorul (processor) și voderul (vocoder) sunt de asemenea disponibile, împreună cu modulul SpeechT5ForSpeechToSpeech. A fost furnizată și o funcție make_spectrogram() pentru a facilita vizualizarea.

说明

100 XP
  • Încarcă modelul preantrenat SpeechT5ForSpeechToSpeech folosind checkpoint-ul microsoft/speecht5_vc.
  • Preprocesează example_speech cu o rată de eșantionare de 16000.
  • Generează vorbirea fără zgomot folosind .generate_speech().