1. Learn
  2. /
  3. Courses
  4. /
  5. Modele multimodalne z Hugging Face

Connected

Exercise

Przekazywanie argumentów słownikowych

W tym ćwiczeniu nauczysz się, jak przekazywać argumenty słownikowe do funkcji modelu używanego wewnątrz potoku.

Skorzystasz z małego modelu MusicGen firmy Meta, który potrafi generować próbki muzyczne na podstawie opisów tekstowych lub promptów audio.

Moduł pipeline jest już załadowany, a biblioteka soundfile jest dostępna jako sf.

Instructions

100 XP
  • Załaduj potok text-to-audio, używając modelu facebook/musicgen-small w środowisku PyTorch.
  • Utwórz słownik o nazwie generate_kwargs, w którym ustawisz temperaturę generowania na 0.8, a max_new_tokens na 1.
  • Wygeneruj tablicę audio, używając promptu "Classic rock riff" i dostosowując parametry generowania za pomocą słownika generate_kwargs.