ComenzarEmpieza gratis

Modelo Faster R-CNN

Tu siguiente tarea es construir un modelo Faster R-CNN que pueda detectar objetos de distintos tamaños en una imagen. Para ello, usarás la práctica clase MultiScaleRoIAlign() de torchvision.ops.

La clase FasterRCNN se ha importado desde torchvision.models.detection. Tu anchor_generator del ejercicio anterior está disponible en tu espacio de trabajo y torch, torch.nn como nn y torchvision ya se han importado.

Este ejercicio forma parte del curso

Deep Learning para imágenes con PyTorch

Ver curso

Instrucciones del ejercicio

  • Importa MultiScaleRoIAlign desde torchvision.ops.
  • Instancia el agrupador RoI usando MultiScaleRoIAlign con featmap_names establecido en ["0"], output_size en 7 y sampling_ratio en 2.
  • Crea el modelo Faster R-CNN pasándole el backbone, num_class para una clasificación binaria, anchor_generator y roi_pooler.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import MultiScaleRoIAlign
____

# Instantiate RoI pooler
roi_pooler = ____(
	____,
	____,
	____,
)

mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280

# Create Faster R-CNN model
model = ____(
	backbone=____
	num_classes=____,
	anchor_generator=____,
	box_roi_pool=____,
)
Editar y ejecutar código