Bouw een video!
Tijd om zelf een video te maken, helemaal vanuit een tekstprompt! Je gebruikt een CogVideoXPipeline-pipeline en de volgende prompt om de generatie te sturen:
Een robot die de robotdans doet. De dansvloer heeft kleurrijke vierkanten en een glitterbal.
Let op: inferentie met videogeneratiemodellen kan lang duren, dus we hebben de gegenereerde video alvast voor je geladen. Het uitvoeren van andere prompts genereert geen nieuwe video's.
De klasse CogVideoXPipeline is al voor je geïmporteerd.
Deze oefening maakt deel uit van de cursus
Multi-modale modellen met Hugging Face
Oefeninstructies
- Maak een
CogVideoXPipelinevanuit hetTHUDM/CogVideoX-2b-checkpoint. - Voer de pipeline uit met de gegeven prompt, met het aantal inferentiestappen op
20, het aantal te genereren frames op20, en de guidance scale op6.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
prompt = "A robot doing the robot dance. The dance floor has colorful squares and a glitterball."
# Create a CogVideoXPipeline
pipe = ____(
"____",
torch_dtype=torch.float16
)
# Run the pipeline with the provided prompt
video = pipe(
prompt=____,
num_inference_steps=____,
num_frames=____,
guidance_scale=____
)
video = video.frames[0]
video_path = export_to_video(video, "output.mp4", fps=8)
video = VideoFileClip(video_path)
video.write_gif("video_ex.gif")