Faster R-CNN modeli

Sıradaki görevin, bir görselde farklı boyutlardaki nesneleri algılayabilen bir Faster R-CNN modeli kurmak. Bu iş için torchvision.ops içindeki kullanışlı MultiScaleRoIAlign() sınıfını kullanacaksın.

FasterRCNN sınıfı torchvision.models.detection içinden içe aktarıldı. Önceki egzersizde oluşturduğun anchor_generator çalışma alanında hazır; ayrıca torch, torch.nn (nn olarak) ve torchvision içe aktarılmış durumda.

Bu egzersiz, kursun bir parçasıdır

PyTorch ile Görüntüler için Deep Learning

Kursa Göz Atın

Egzersiz talimatları

torchvision.ops içinden MultiScaleRoIAlign'ı içe aktar.
RoI havuzlayıcısını MultiScaleRoIAlign ile başlat; featmap_names değerini ["0"], output_size değerini 7 ve sampling_ratio değerini 2 olarak ayarla.
backbone, ikili sınıflandırma için num_class, anchor_generator ve roi_pooler vererek Faster R-CNN modelini oluştur.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import MultiScaleRoIAlign
____

# Instantiate RoI pooler
roi_pooler = ____(
	____,
	____,
	____,
)

mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280

# Create Faster R-CNN model
model = ____(
	backbone=____
	num_classes=____,
	anchor_generator=____,
	box_roi_pool=____,
)

Kodu Düzenle ve Çalıştır