Faster R-CNN modeli
Sıradaki görevin, bir görselde farklı boyutlardaki nesneleri algılayabilen bir Faster R-CNN modeli kurmak. Bu iş için torchvision.ops içindeki kullanışlı MultiScaleRoIAlign() sınıfını kullanacaksın.
FasterRCNN sınıfı torchvision.models.detection içinden içe aktarıldı. Önceki egzersizde oluşturduğun anchor_generator çalışma alanında hazır; ayrıca torch, torch.nn (nn olarak) ve torchvision içe aktarılmış durumda.
Bu egzersiz
PyTorch ile Görüntüler için Deep Learning
kursunun bir parçasıdırEgzersiz talimatları
torchvision.opsiçindenMultiScaleRoIAlign'ı içe aktar.- RoI havuzlayıcısını
MultiScaleRoIAlignile başlat;featmap_namesdeğerini["0"],output_sizedeğerini7vesampling_ratiodeğerini2olarak ayarla. backbone, ikili sınıflandırma içinnum_class,anchor_generatorveroi_poolervererek Faster R-CNN modelini oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import MultiScaleRoIAlign
____
# Instantiate RoI pooler
roi_pooler = ____(
____,
____,
____,
)
mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280
# Create Faster R-CNN model
model = ____(
backbone=____
num_classes=____,
anchor_generator=____,
box_roi_pool=____,
)