Zero-shot učení s CLIP

Pomocí zero-shot učení klasifikuješ obrázek z datasetu rajuptvs/ecommerce_products_clip, který obsahuje přibližně 2 000 obrázků produktů spolu s jejich popisky:

Obrázek ženy v šatech

Dataset (dataset), CLIPProcessor (processor) a CLIPModel (model) jsou už načteny, stejně jako seznam kategorií:

categories = ["shirt", "trousers", "shoes", "dress", "hat", 
              "bag", "watch", "glasses", "jacket", "belt"]

Pomocí processoru předzpracuj categories a obrázek na indexu 999 z datasetu; povol padding.
Předej rozbalené inputs do modelu.
Vypočítej pravděpodobnosti jednotlivých kategorií pomocí atributu .logits_per_image a metody .softmax().
Najdi nejpravděpodobnější kategorii pomocí probs a categories.

cvičení

Zero-shot učení s CLIP

Pokyny

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení