ComeçarComece de graça

Passando argumentos de palavra-chave

Neste exercício, você vai aprender como passar argumentos de palavras-chave para funções de modelo quando usadas dentro de um pipeline.

Pra isso, você vai usar o modelo pequeno MusicGen da Meta, que consegue gerar amostras de música com base em descrições de texto ou comandos de áudio.

O módulo pipeline foi carregado e a biblioteca soundfile está disponível como sf.

Este exercício faz parte do curso

Modelos multimodais com Hugging Face

Ver curso

Instruções do exercício

  • Carregue um pipeline de text-to-audio usando o modelo facebook/musicgen-small na estrutura PyTorch.
  • Crie um dicionário para definir a temperatura de geração como 0.8 e max_new_tokens como 1.
  • Crie uma matriz de áudio que combine com o prompt “ "Classic rock riff" ”.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load a text-to-audio pipeline
musicgen = pipeline(task="____", model="____", framework="pt")

# Make a dictionary to set the generation temperature to 0.8 and max_new_tokens to 1
generate_kwargs = {"____": ____, "____": ____}

# Generate an audio array passing the arguments
outputs = ____
sf.write("output.wav", outputs["audio"][0][0], outputs["sampling_rate"])
Editar e executar o código