ComenzarEmpieza gratis

Modelo R-CNN más rápido

Tu siguiente tarea consiste en crear un modelo Faster R-CNN capaz de detectar objetos de diferentes tamaños en una imagen. Para esta tarea, utilizarás una clase muy útil llamada « MultiScaleRoIAlign() » (clase de controlador de eventos) de torchvision.ops.

FasterRCNN La clase se ha importado desde torchvision.models.detection. Tu archivo anchor_generator del último ejercicio está disponible en tu espacio de trabajo y torch, torch.nn como nn, y torchvision se han importado.

Este ejercicio forma parte del curso

Aprendizaje profundo para imágenes con PyTorch

Ver curso

Instrucciones del ejercicio

  • Importa MultiScaleRoIAlign desde torchvision.ops.
  • Instancia el agrupador RoI utilizando MultiScaleRoIAlign con featmap_names establecido en ["0"], output_size en 7 y sampling_ratio en 2.
  • Crea el modelo Faster R-CNN pasándole el backbone, num_class para una clasificación binaria, anchor_generator y roi_pooler.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Import MultiScaleRoIAlign
____

# Instantiate RoI pooler
roi_pooler = ____(
	____,
	____,
	____,
)

mobilenet = torchvision.models.mobilenet_v2(weights="DEFAULT")
backbone = nn.Sequential(*list(mobilenet.features.children()))
backbone.out_channels = 1280

# Create Faster R-CNN model
model = ____(
	backbone=____
	num_classes=____,
	anchor_generator=____,
	box_roi_pool=____,
)
Editar y ejecutar código