IniziaInizia gratis

Prompting dei modelli Vision Language (VLM)

Nei prossimi due esercizi userai un modello multi-modale per analizzare il sentiment di un articolo di news e della sua immagine di copertina corrispondente dal dataset BBC News su Hugging Face:

BBC News dataset card

Per iniziare, preparerai un chat template per il modello che includa sia l'immagine sia l'articolo. Il dataset (dataset) e l'immagine di copertina (image) sono già stati caricati.

Questo esercizio fa parte del corso

Modelli multi-modali con Hugging Face

Visualizza il corso

Istruzioni dell'esercizio

  • Carica il contenuto dell'articolo di news (content) dal datapoint all'indice 6 in dataset.
  • Completa la query di testo per inserire content in text_query usando le f-string.
  • Aggiungi image e text_query al chat template, specificando il tipo di contenuto di text_query come "text".

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load the news article content from datapoint 6
content = ____

# Complete the text query
text_query = f"Does the news article have a positive, negative, or neutral impact on championship winning chances: {____}. Provide reasoning."

# Add the text query dictionary to the chat template
chat_template = [
    {
        "role": "user",
        "content": [
            {
                "type": "image",
                "image": ____,
            },
            ____
        ],
    }
]
Modifica ed esegui il codice