1. 학습
  2. /
  3. 강의
  4. /
  5. Hugging Face로 배우는 멀티모달 모델

Connected

연습 문제

객체 탐지

이 연습 문제에서는 앞서 사용한 flickr 데이터셋을 다시 사용해요. 이 데이터셋에는 30,000장의 이미지와 관련 캡션이 있어요. 이제 모델이 탐지한 객체의 바운딩 박스를 찾아보겠습니다.

Photo of 2 people, 1 is playing the guitar

샘플 이미지(image)와 파이프라인 모듈(pipeline)이 로드되어 있어요.

지침

100 XP
  • facebook/detr-resnet-50 사전 학습 모델로 object-detection 파이프라인을 로드하세요.
  • 탐지된 객체의 label을 찾으세요.
  • 해당 객체의 신뢰도 score를 찾으세요.
  • 해당 객체의 바운딩 box 좌표를 찾으세요.