Model Faster R-CNN
Tugas Anda berikutnya adalah membangun model Faster R-CNN yang dapat mendeteksi objek dengan berbagai ukuran dalam sebuah gambar. Untuk tugas ini, Anda akan menggunakan kelas praktis MultiScaleRoIAlign() dari torchvision.ops.
Kelas FasterRCNN telah diimpor dari torchvision.models.detection. anchor_generator dari latihan sebelumnya tersedia di ruang kerja Anda dan torch, torch.nn sebagai nn, serta torchvision telah diimpor.
Latihan ini adalah bagian dari kursus
Deep Learning untuk Gambar dengan PyTorch
Petunjuk latihan
- Impor
MultiScaleRoIAligndaritorchvision.ops. - Instansiasi RoI pooler menggunakan
MultiScaleRoIAligndenganfeatmap_namesdisetel ke["0"],output_sizeke7, dansampling_ratioke2. - Buat model Faster R-CNN dengan meneruskan
backbone,num_classuntuk klasifikasi biner,anchor_generator, danroi_pooler.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import MultiScaleRoIAlign
____
# Instantiate RoI pooler
roi_pooler = ____(
____,
____,
____,
)
mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280
# Create Faster R-CNN model
model = ____(
backbone=____
num_classes=____,
anchor_generator=____,
box_roi_pool=____,
)