ComenzarEmpieza gratis

Relleno de imágenes

Demos un giro a la generación de imágenes multimodales combinándola con el relleno de imágenes. Modificarás el autorretrato de Van Gogh para que tenga barba negra utilizando la herramienta « StableDiffusionControlNetInpaintPipeline » (Boca) y una máscara de imagen que se ha creado para ti (mask_image):

Famoso cuadro de Van Gogh y máscara

Nota: La inferencia en modelos de difusión puede llevar mucho tiempo, por lo que hemos precargado la imagen generada para ti. Ejecutar diferentes comandos no generará nuevas imágenes.

La versión original de la imagen se ha cargado como init_image, junto con una imagen de control (control_image) creada con la función make_inpaint_condition() del vídeo.

Este ejercicio forma parte del curso

Modelos multimodales con Hugging Face

Ver curso

Instrucciones del ejercicio

  • Ejecuta el pipeline con un prompt diseñado para generar una barba negra, especificando num_inference_steps=40 y pasando init_image, mask_image y control_image.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Run the pipeline requesting a black beard
output = pipe(
    ____,
    num_inference_steps=____,
    eta=1.0,
    image=____,
    mask_image=____,
    control_image=____
)

plt.imshow(output.images[0])
plt.show()
Editar y ejecutar código