Aan de slagGa gratis aan de slag

Bouw een video!

Tijd om zelf een video te maken, helemaal vanuit een tekstprompt! Je gebruikt een CogVideoXPipeline-pipeline en de volgende prompt om de generatie te sturen:

Een robot die de robotdans doet. De dansvloer heeft kleurrijke vierkanten en een glitterbal.

Let op: inferentie met videogeneratiemodellen kan lang duren, dus we hebben de gegenereerde video alvast voor je geladen. Het uitvoeren van andere prompts genereert geen nieuwe video's.

De klasse CogVideoXPipeline is al voor je geïmporteerd.

Deze oefening maakt deel uit van de cursus

Multi-modale modellen met Hugging Face

Cursus bekijken

Oefeninstructies

  • Maak een CogVideoXPipeline vanuit het THUDM/CogVideoX-2b-checkpoint.
  • Voer de pipeline uit met de gegeven prompt, met het aantal inferentiestappen op 20, het aantal te genereren frames op 20, en de guidance scale op 6.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

prompt = "A robot doing the robot dance. The dance floor has colorful squares and a glitterball."

# Create a CogVideoXPipeline
pipe = ____(
    "____",
    torch_dtype=torch.float16
)

# Run the pipeline with the provided prompt
video = pipe(
    prompt=____,
    num_inference_steps=____,
    num_frames=____,
    guidance_scale=____
)
video = video.frames[0]

video_path = export_to_video(video, "output.mp4", fps=8)
video = VideoFileClip(video_path)
video.write_gif("video_ex.gif")
Code bewerken en uitvoeren