Modelo R-CNN mais rápido
A próxima tarefa é criar um modelo Faster R-CNN que consiga detectar objetos de tamanhos diferentes em uma imagem. Pra essa tarefa, você vai usar uma classe bem útil chamada MultiScaleRoIAlign(), que tá em torchvision.ops.
FasterRCNN A classe foi importada de torchvision.models.detection. Seu arquivo “ anchor_generator ” do último exercício tá disponível na sua área de trabalho e os arquivos “ torch ”, “ torch.nn ”, “ nn ” e “ torchvision ” foram importados.
Este exercício faz parte do curso
Aprendizado profundo para imagens com PyTorch
Instruções do exercício
- Importe
MultiScaleRoIAligndetorchvision.ops. - Instanciar o pooler RoI usando
MultiScaleRoIAligncomfeatmap_namesdefinido como["0"],output_sizecomo7esampling_ratiocomo2. - Crie o modelo Faster R-CNN passando-lhe o
backbone,num_classpara uma classificação binária,anchor_generatoreroi_pooler.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import MultiScaleRoIAlign
____
# Instantiate RoI pooler
roi_pooler = ____(
____,
____,
____,
)
mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280
# Create Faster R-CNN model
model = ____(
backbone=____
num_classes=____,
anchor_generator=____,
box_roi_pool=____,
)