ComenzarEmpieza gratis

Pasar argumentos clave

En este ejercicio, aprenderás a pasar argumentos clave a funciones de modelo cuando se utilizan dentro de una canalización.

Para ello, utilizarás el modelo pequeño MusicGen de Meta, que es capaz de generar muestras musicales a partir de descripciones de texto o indicaciones de audio.

Se ha cargado el módulo « pipeline » y la biblioteca « soundfile » está disponible como « sf ».

Este ejercicio forma parte del curso

Modelos multimodales con Hugging Face

Ver curso

Instrucciones del ejercicio

  • Carga una canalización de « text-to-audio » utilizando el modelo « facebook/musicgen-small » en el marco PyTorch.
  • Crea un diccionario para establecer la temperatura de generación en 0.8 y max_new_tokens en 1.
  • Genera un arreglo de audio correspondiente al mensaje « "Classic rock riff" ».

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load a text-to-audio pipeline
musicgen = pipeline(task="____", model="____", framework="pt")

# Make a dictionary to set the generation temperature to 0.8 and max_new_tokens to 1
generate_kwargs = {"____": ____, "____": ____}

# Generate an audio array passing the arguments
outputs = ____
sf.write("output.wav", outputs["audio"][0][0], outputs["sampling_rate"])
Editar y ejecutar código