1. 学ぶ
  2. /
  3. コース
  4. /
  5. PyTorch で学ぶ画像向け Deep Learning

Connected

演習

Faster R-CNN モデル

次のタスクは、画像内のさまざまなサイズの物体を検出できる Faster R-CNN モデルを構築することです。ここでは、torchvision.ops の便利なクラス MultiScaleRoIAlign() を使用します。

FasterRCNN クラスは torchvision.models.detection からインポート済みです。前の演習で作成した anchor_generator はワークスペースに用意されています。torch、torch.nn(nn として)、および torchvision もインポート済みです。

指示

100 XP
  • torchvision.ops から MultiScaleRoIAlign をインポートします。
  • MultiScaleRoIAlign を使って RoI プーラーを作成し、featmap_names を ["0"]、output_size を 7、sampling_ratio を 2 に設定します。
  • backbone、バイナリ分類用の num_class、anchor_generator、roi_pooler を渡して Faster R-CNN モデルを作成します。