ComenzarEmpieza gratis

¡Crea un vídeo!

¡Es hora de que te animes a crear un vídeo a partir de un texto! Utilizarás una tubería CogVideoXPipeline y el siguiente indicador para guiar la generación:

Un robot haciendo el baile del robot. La pista de baile tiene cuadrados de colores y una bola de espejos.

Nota: La inferencia en los modelos de generación de vídeo puede llevar mucho tiempo, por lo que hemos precargado el vídeo generado para ti. Ejecutar diferentes indicaciones no generará nuevos vídeos.

La clase « CogVideoXPipeline » ya se ha importado por ti.

Este ejercicio forma parte del curso

Modelos multimodales con Hugging Face

Ver curso

Instrucciones del ejercicio

  • Crea un archivo de imagen de sistema ( CogVideoXPipeline ) desde el punto de control de imagen de sistema ( THUDM/CogVideoX-2b ).
  • Ejecuta el proceso con el comando proporcionado, estableciendo el número de pasos de inferencia en 20, el número de fotogramas que se van a generar en 20 y la escala de orientación en 6.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

prompt = "A robot doing the robot dance. The dance floor has colorful squares and a glitterball."

# Create a CogVideoXPipeline
pipe = ____(
    "____",
    torch_dtype=torch.float16
)

# Run the pipeline with the provided prompt
video = pipe(
    prompt=____,
    num_inference_steps=____,
    num_frames=____,
    guidance_scale=____
)
video = video.frames[0]

video_path = export_to_video(video, "output.mp4", fps=8)
video = VideoFileClip(video_path)
video.write_gif("video_ex.gif")
Editar y ejecutar código