学ぶ

/

コース

/

Hugging Face で学ぶマルチモーダルモデル

Connected

演習

物体検出

この演習では、前と同じ flickr データセット（3万枚の画像とキャプション付き）を使います。今回は、モデルが検出した物体のバウンディングボックスを見つけます。

Photo of 2 people, 1 is playing the guitar

サンプル画像（image）とパイプラインモジュール（pipeline）は読み込まれています。

指示

100 XP

facebook/detr-resnet-50 の事前学習モデルで object-detection パイプラインを読み込みます。
検出された物体の label を取得します。
検出結果に対応する信頼度 score を取得します。
検出された物体のバウンディング box の座標を取得します。