Learn

/

Courses

/

Modele multimodalne z Hugging Face

Connected

Exercise

Przekazywanie argumentów słownikowych

W tym ćwiczeniu nauczysz się, jak przekazywać argumenty słownikowe do funkcji modelu używanego wewnątrz potoku.

Skorzystasz z małego modelu MusicGen firmy Meta, który potrafi generować próbki muzyczne na podstawie opisów tekstowych lub promptów audio.

Moduł pipeline jest już załadowany, a biblioteka soundfile jest dostępna jako sf.

Instructions

100 XP

Załaduj potok text-to-audio, używając modelu facebook/musicgen-small w środowisku PyTorch.
Utwórz słownik o nazwie generate_kwargs, w którym ustawisz temperaturę generowania na 0.8, a max_new_tokens na 1.
Wygeneruj tablicę audio, używając promptu "Classic rock riff" i dostosowując parametry generowania za pomocą słownika generate_kwargs.