Prompting dei modelli Vision Language (VLM)
Nei prossimi due esercizi userai un modello multi-modale per analizzare il sentiment di un articolo di news e della sua immagine di copertina corrispondente dal dataset BBC News su Hugging Face:

Per iniziare, preparerai un chat template per il modello che includa sia l'immagine sia l'articolo. Il dataset (dataset) e l'immagine di copertina (image) sono già stati caricati.
Questo esercizio fa parte del corso
Modelli multi-modali con Hugging Face
Istruzioni dell'esercizio
- Carica il contenuto dell'articolo di news (
content) dal datapoint all'indice6indataset. - Completa la query di testo per inserire
contentintext_queryusando le f-string. - Aggiungi
imageetext_queryal chat template, specificando il tipo di contenuto ditext_querycome"text".
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load the news article content from datapoint 6
content = ____
# Complete the text query
text_query = f"Does the news article have a positive, negative, or neutral impact on championship winning chances: {____}. Provide reasoning."
# Add the text query dictionary to the chat template
chat_template = [
{
"role": "user",
"content": [
{
"type": "image",
"image": ____,
},
____
],
}
]