Modelo R-CNN más rápido
Tu siguiente tarea consiste en crear un modelo Faster R-CNN capaz de detectar objetos de diferentes tamaños en una imagen. Para esta tarea, utilizarás una clase muy útil llamada « MultiScaleRoIAlign()
» (clase de controlador de eventos) de torchvision.ops
.
FasterRCNN
La clase se ha importado desde torchvision.models.detection
. Tu archivo anchor_generator
del último ejercicio está disponible en tu espacio de trabajo y torch
, torch.nn
como nn
, y torchvision
se han importado.
Este ejercicio forma parte del curso
Aprendizaje profundo para imágenes con PyTorch
Instrucciones del ejercicio
- Importa
MultiScaleRoIAlign
desdetorchvision.ops
. - Instancia el agrupador RoI utilizando
MultiScaleRoIAlign
confeatmap_names
establecido en["0"]
,output_size
en7
ysampling_ratio
en2
. - Crea el modelo Faster R-CNN pasándole el
backbone
,num_class
para una clasificación binaria,anchor_generator
yroi_pooler
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Import MultiScaleRoIAlign
____
# Instantiate RoI pooler
roi_pooler = ____(
____,
____,
____,
)
mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280
# Create Faster R-CNN model
model = ____(
backbone=____
num_classes=____,
anchor_generator=____,
box_roi_pool=____,
)