1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Deep Learning cho Ảnh với PyTorch

Connected

Bài tập

Mô hình Faster R-CNN

Nhiệm vụ tiếp theo của bạn là xây dựng một mô hình Faster R-CNN có thể phát hiện các đối tượng với nhiều kích thước khác nhau trong một ảnh. Cho nhiệm vụ này, bạn sẽ dùng lớp tiện dụng MultiScaleRoIAlign() từ torchvision.ops.

Lớp FasterRCNN đã được nhập từ torchvision.models.detection. anchor_generator từ bài trước có sẵn trong không gian làm việc của bạn và torch, torch.nn dưới tên nn, cùng torchvision đã được nhập.

Hướng dẫn

100 XP
  • Nhập MultiScaleRoIAlign từ torchvision.ops.
  • Khởi tạo RoI pooler bằng MultiScaleRoIAlign với featmap_names đặt là ["0"], output_size là 7, và sampling_ratio là 2.
  • Tạo mô hình Faster R-CNN, truyền vào backbone, num_class cho bài toán phân loại nhị phân, anchor_generator, và roi_pooler.