Model Faster R-CNN

Tvým dalším úkolem je sestavit model Faster R-CNN, který dokáže v obrázku detekovat objekty různých velikostí. K tomu využiješ šikovnou třídu MultiScaleRoIAlign() z balíčku torchvision.ops.

Třída FasterRCNN byla naimportována z torchvision.models.detection. anchor_generator z předchozího cvičení máš k dispozici ve svém pracovním prostředí a torch, torch.nn jako nn a torchvision jsou také naimportovány.

Naimportuj MultiScaleRoIAlign z torchvision.ops.
Vytvoř instanci RoI pooleru pomocí MultiScaleRoIAlign s parametrem featmap_names nastaveným na ["0"], output_size na 7 a sampling_ratio na 2.
Sestav model Faster R-CNN a předej mu backbone, num_class pro binární klasifikaci, anchor_generator a roi_pooler.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení