Zero-shot learning z CLIP

Skorzystaj z techniki zero-shot learning, aby sklasyfikować obraz ze zbioru danych rajuptvs/ecommerce_products_clip, zawierającego około 2 tys. zdjęć produktów wraz z opisami:

Obraz kobiety prezentującej sukienkę

Zbiór danych (dataset), CLIPProcessor (processor) i CLIPModel (model) zostały już wczytane, podobnie jak lista kategorii:

categories = ["shirt", "trousers", "shoes", "dress", "hat", 
              "bag", "watch", "glasses", "jacket", "belt"]

Użyj processor, aby wstępnie przetworzyć categories i obraz pod indeksem 999 ze zbioru dataset; włącz padding.
Przekaż rozpakowane inputs do model.
Oblicz prawdopodobieństwa każdej kategorii, używając atrybutu .logits_per_image i metody .softmax().
Znajdź najbardziej prawdopodobną kategorię, korzystając z probs i categories.

ćwiczenie

Zero-shot learning z CLIP

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie