¡Crea un vídeo!
¡Es hora de que te animes a crear un vídeo a partir de un texto! Utilizarás una tubería CogVideoXPipeline y el siguiente indicador para guiar la generación:
Un robot haciendo el baile del robot. La pista de baile tiene cuadrados de colores y una bola de espejos.
Nota: La inferencia en los modelos de generación de vídeo puede llevar mucho tiempo, por lo que hemos precargado el vídeo generado para ti. Ejecutar diferentes indicaciones no generará nuevos vídeos.
La clase « CogVideoXPipeline » ya se ha importado por ti.
Este ejercicio forma parte del curso
Modelos multimodales con Hugging Face
Instrucciones del ejercicio
- Crea un archivo de imagen de sistema (
CogVideoXPipeline) desde el punto de control de imagen de sistema (THUDM/CogVideoX-2b). - Ejecuta el proceso con el comando proporcionado, estableciendo el número de pasos de inferencia en
20, el número de fotogramas que se van a generar en20y la escala de orientación en6.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
prompt = "A robot doing the robot dance. The dance floor has colorful squares and a glitterball."
# Create a CogVideoXPipeline
pipe = ____(
"____",
torch_dtype=torch.float16
)
# Run the pipeline with the provided prompt
video = pipe(
prompt=____,
num_inference_steps=____,
num_frames=____,
guidance_scale=____
)
video = video.frames[0]
video_path = export_to_video(video, "output.mp4", fps=8)
video = VideoFileClip(video_path)
video.write_gif("video_ex.gif")