1. 学ぶ
  2. /
  3. コース
  4. /
  5. Modele multimodalne z Hugging Face

Connected

演習

Wykrywanie obiektów

W tym ćwiczeniu użyjesz tego samego zbioru danych flickr, co poprzednio – zawiera on 30 000 obrazów z powiązanymi opisami. Tym razem znajdziesz ramki ograniczające (bounding boxes) obiektów wykrytych przez model.

Zdjęcie 2 osób, jedna gra na gitarze

Przykładowy obraz (image) oraz moduł potoku (pipeline) zostały już wczytane.

指示

100 XP
  • Wczytaj potok object-detection z wytrenowanym modelem facebook/detr-resnet-50.
  • Znajdź etykietę (label) wykrytego obiektu.
  • Znajdź powiązany wynik pewności (score) wykrytego obiektu.
  • Znajdź współrzędne ramki ograniczającej (box) wykrytego obiektu.