Model Faster R-CNN

Tugas Anda berikutnya adalah membangun model Faster R-CNN yang dapat mendeteksi objek dengan berbagai ukuran dalam sebuah gambar. Untuk tugas ini, Anda akan menggunakan kelas praktis MultiScaleRoIAlign() dari torchvision.ops.

Kelas FasterRCNN telah diimpor dari torchvision.models.detection. anchor_generator dari latihan sebelumnya tersedia di ruang kerja Anda dan torch, torch.nn sebagai nn, serta torchvision telah diimpor.

Latihan ini adalah bagian dari kursus

Deep Learning untuk Gambar dengan PyTorch

Lihat Kursus

Petunjuk latihan

Impor MultiScaleRoIAlign dari torchvision.ops.
Instansiasi RoI pooler menggunakan MultiScaleRoIAlign dengan featmap_names disetel ke ["0"], output_size ke 7, dan sampling_ratio ke 2.
Buat model Faster R-CNN dengan meneruskan backbone, num_class untuk klasifikasi biner, anchor_generator, dan roi_pooler.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import MultiScaleRoIAlign
____

# Instantiate RoI pooler
roi_pooler = ____(
	____,
	____,
	____,
)

mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280

# Create Faster R-CNN model
model = ____(
	backbone=____
	num_classes=____,
	anchor_generator=____,
	box_roi_pool=____,
)

Edit dan Jalankan Kode