Passando argumentos de palavra-chave
Neste exercício, você vai aprender como passar argumentos de palavras-chave para funções de modelo quando usadas dentro de um pipeline.
Pra isso, você vai usar o modelo pequeno MusicGen da Meta, que consegue gerar amostras de música com base em descrições de texto ou comandos de áudio.
O módulo pipeline foi carregado e a biblioteca soundfile está disponível como sf.
Este exercício faz parte do curso
Modelos multimodais com Hugging Face
Instruções do exercício
- Carregue um pipeline de
text-to-audiousando o modelofacebook/musicgen-smallna estrutura PyTorch. - Crie um dicionário para definir a temperatura de geração como
0.8emax_new_tokenscomo1. - Crie uma matriz de áudio que combine com o prompt “
"Classic rock riff"”.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load a text-to-audio pipeline
musicgen = pipeline(task="____", model="____", framework="pt")
# Make a dictionary to set the generation temperature to 0.8 and max_new_tokens to 1
generate_kwargs = {"____": ____, "____": ____}
# Generate an audio array passing the arguments
outputs = ____
sf.write("output.wav", outputs["audio"][0][0], outputs["sampling_rate"])