1. Nauka
  2. /
  3. Kursy
  4. /
  5. Głębokie uczenie dla obrazów z PyTorch

Connected

ćwiczenie

Model Faster R-CNN

Twoim kolejnym zadaniem jest zbudowanie modelu Faster R-CNN, który wykrywa obiekty różnej wielkości na obrazie. W tym celu skorzystasz z wygodnej klasy MultiScaleRoIAlign() z modułu torchvision.ops.

Klasa FasterRCNN została już zaimportowana z torchvision.models.detection. Twój anchor_generator z poprzedniego ćwiczenia jest dostępny w przestrzeni roboczej, a torch, torch.nn jako nn oraz torchvision są już zaimportowane.

Instrukcje

100 XP
  • Zaimportuj MultiScaleRoIAlign z torchvision.ops.
  • Utwórz instancję puli RoI, używając MultiScaleRoIAlign z parametrem featmap_names ustawionym na ["0"], output_size na 7 oraz sampling_ratio na 2.
  • Utwórz model Faster R-CNN, przekazując mu backbone, num_class dla klasyfikacji binarnej, anchor_generator oraz roi_pooler.