Model Faster R-CNN

Twoim kolejnym zadaniem jest zbudowanie modelu Faster R-CNN, który wykrywa obiekty różnej wielkości na obrazie. W tym celu skorzystasz z wygodnej klasy MultiScaleRoIAlign() z modułu torchvision.ops.

Klasa FasterRCNN została już zaimportowana z torchvision.models.detection. Twój anchor_generator z poprzedniego ćwiczenia jest dostępny w przestrzeni roboczej, a torch, torch.nn jako nn oraz torchvision są już zaimportowane.

Zaimportuj MultiScaleRoIAlign z torchvision.ops.
Utwórz instancję puli RoI, używając MultiScaleRoIAlign z parametrem featmap_names ustawionym na ["0"], output_size na 7 oraz sampling_ratio na 2.
Utwórz model Faster R-CNN, przekazując mu backbone, num_class dla klasyfikacji binarnej, anchor_generator oraz roi_pooler.

ćwiczenie

Model Faster R-CNN

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie