1. Learn
  2. /
  3. Courses
  4. /
  5. Hugging Face で学ぶマルチモーダルモデル

Connected

Exercise

物体検出

この演習では、前と同じ flickr データセット(3万枚の画像とキャプション付き)を使います。今回は、モデルが検出した物体のバウンディングボックスを見つけます。

Photo of 2 people, 1 is playing the guitar

サンプル画像(image)とパイプラインモジュール(pipeline)は読み込まれています。

Instructions

100 XP
  • facebook/detr-resnet-50 の事前学習モデルで object-detection パイプラインを読み込みます。
  • 検出された物体の label を取得します。
  • 検出結果に対応する信頼度 score を取得します。
  • 検出された物体のバウンディング box の座標を取得します。