ComeçarComece de graça

Modelos de linguagem de visão por prompt (VLMs)

Nos próximos dois exercícios, você vai usar um modelo multimodal pra analisar o sentimento de uma notícia e a imagem correspondente do cabeçalho do conjunto de dados BBC News no Hugging Face:

Cartão de dados da BBC News

Pra começar, você vai preparar um modelo de chat pro modelo que inclua tanto a imagem quanto a notícia. O conjunto de dados (dataset) e a imagem principal (image) foram carregados.

Este exercício faz parte do curso

Modelos multimodais com Hugging Face

Ver curso

Instruções do exercício

  • Carregue o conteúdo da notícia (content) do ponto de dados no índice 6 no dataset.
  • Complete a consulta de texto para inserir “ content ” em “ text_query ” usando f-strings.
  • Adicione image e text_query ao modelo de chat, especificando o tipo de conteúdo de text_query como "text".

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load the news article content from datapoint 6
content = ____

# Complete the text query
text_query = f"Does the news article have a positive, negative, or neutral impact on championship winning chances: {____}. Provide reasoning."

# Add the text query dictionary to the chat template
chat_template = [
    {
        "role": "user",
        "content": [
            {
                "type": "image",
                "image": ____,
            },
            ____
        ],
    }
]
Editar e executar o código