1. Learn
  2. /
  3. Cursuri
  4. /
  5. Modele Multi-Modale cu Hugging Face

Connected

exercițiu

Promptarea modelelor de limbaj vizual (VLM)

În următoarele două exerciții, vei folosi un model multi-modal pentru a analiza sentimentul unui articol de știri și al imaginii din titlu corespunzătoare, din setul de date BBC News de pe Hugging Face:

BBC News dataset card

Pentru început, vei pregăti un șablon de chat pentru model care include atât imaginea, cât și articolul de știri. Setul de date (dataset) și imaginea din titlu (image) au fost deja încărcate.

Instrucțiuni

100 XP
  • Încarcă conținutul articolului de știri (content) din punctul de date de la indexul 6 din dataset.
  • Completează interogarea text pentru a insera content în text_query folosind f-string-uri.
  • Adaugă image și text_query în șablonul de chat, specificând tipul de conținut al lui text_query ca "text".