Übergabe von Schlüsselwortargumenten
In dieser Übung lernst du, wie du Schlüsselwortargumente an Modellfunktionen weitergibst, wenn du sie in einer Pipeline verwendest.
Dafür nimmst du das kleine Modell MusicGen von Meta, das Musikbeispiele anhand von Textbeschreibungen oder Audio-Eingaben machen kann.
Das Modul „ pipeline “ wurde geladen und die Bibliothek „ soundfile “ ist unter „ sf “ verfügbar.
Diese Übung ist Teil des Kurses
Multimodale Modelle mit Hugging Face
Anleitung zur Übung
- Lade eine Pipeline „
text-to-audio” mit dem Modell „facebook/musicgen-small” im PyTorch-Framework. - Mach ein Wörterbuch, um die Generierungstemperatur auf „
0.8“ und „max_new_tokens“ auf „1“ zu setzen. - Erzeuge ein Audio-Array, das der Eingabeaufforderung „
"Classic rock riff"“ entspricht.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load a text-to-audio pipeline
musicgen = pipeline(task="____", model="____", framework="pt")
# Make a dictionary to set the generation temperature to 0.8 and max_new_tokens to 1
generate_kwargs = {"____": ____, "____": ____}
# Generate an audio array passing the arguments
outputs = ____
sf.write("output.wav", outputs["audio"][0][0], outputs["sampling_rate"])