1. Learn
  2. /
  3. Courses
  4. /
  5. Hugging Face で学ぶマルチモーダルモデル

Connected

Exercise

キーワード引数を渡す

この演習では、パイプライン内でモデル関数にキーワード引数を渡す方法を学びます。

ここでは、Meta の小型モデルである MusicGen を使います。これはテキスト説明や音声プロンプトに基づいて音楽サンプルを生成できます。

pipeline モジュールは読み込まれており、soundfile ライブラリは sf として利用できます。

Instructions

100 XP
  • PyTorch フレームワークで facebook/musicgen-small モデルを使い、text-to-audio パイプラインを読み込みます。
  • 生成温度を 0.8、max_new_tokens を 1 に設定する辞書 generate_kwargs を作成します。
  • "Classic rock riff" というプロンプトを使って音声配列を生成し、generate_kwargs 辞書で生成パラメータを調整します。