Preenchimento de imagens
Vamos dar uma reviravolta na geração de imagens multimodais combinando-a com a restauração de imagens. Você vai modificar o autorretrato de Van Gogh para que ele tenha uma barba preta usando a ferramenta “ StableDiffusionControlNetInpaintPipeline ” e uma máscara de imagem, que foi criada para você (mask_image):

Observação: A inferência em modelos de difusão pode demorar um pouco, então a gente já carregou a imagem gerada pra você. Executar diferentes comandos não vai gerar novas imagens.
A versão original da imagem foi carregada como init_image, junto com uma imagem de controle (control_image) criada com a função make_inpaint_condition() do vídeo.
Este exercício faz parte do curso
Modelos multimodais com Hugging Face
Instruções do exercício
- Execute o pipeline com um prompt feito pra gerar uma barba preta, colocando
num_inference_steps=40e passando oinit_image,mask_imageecontrol_image.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Run the pipeline requesting a black beard
output = pipe(
____,
num_inference_steps=____,
eta=1.0,
image=____,
mask_image=____,
control_image=____
)
plt.imshow(output.images[0])
plt.show()