1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Multi-Modal Models with Hugging Face

Connected

cvičení

Generování popisků pomocí pipeline

V tomto cvičení opět použiješ dataset flickr, který obsahuje 30 000 obrázků s přiřazenými popisky. Tentokrát vygeneruješ popisek k následujícímu obrázku pomocí pipeline místo tříd auto.

Photo of a man standing on a ladder cleaning a window

Dataset (dataset) byl načten s touto strukturou:

Dataset({
    features: ['image', 'caption', 'sentids', 'split', 'img_id', 'filename'],
    num_rows: 10
})

Modul pipeline (pipeline) je již načtený.

Pokyny

100 XP
  • Načti pipeline image-to-text s předtrénovaným modelem Salesforce/blip-image-captioning-base.
  • Pomocí pipeline vygeneruj popisek pro obrázek na indexu 3.