Prompts schrijven voor Vision Language Models (VLM's)
In de komende twee oefeningen gebruik je een multi-modale model om de sentimenten te analyseren van een nieuwsartikel en de bijbehorende kopafbeelding uit de BBC News-gegevensset op Hugging Face:

Om te beginnen maak je een chattemplate voor het model die zowel de afbeelding als het nieuwsartikel bevat. De gegevensset (dataset) en de kopafbeelding (image) zijn geladen.
Deze oefening maakt deel uit van de cursus
Multi-modale modellen met Hugging Face
Oefeninstructies
- Laad de inhoud van het nieuwsartikel (
content) uit het datapunt op index6in dedataset. - Maak de tekstquery af om
contentin te voegen intext_querymet f-strings. - Voeg de
imageentext_querytoe aan de chattemplate en geef voortext_queryhet contenttype op als"text".
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the news article content from datapoint 6
content = ____
# Complete the text query
text_query = f"Does the news article have a positive, negative, or neutral impact on championship winning chances: {____}. Provide reasoning."
# Add the text query dictionary to the chat template
chat_template = [
{
"role": "user",
"content": [
{
"type": "image",
"image": ____,
},
____
],
}
]