1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Deep Learning pro obrázky s PyTorchem

Connected

cvičení

Model Faster R-CNN

Tvým dalším úkolem je sestavit model Faster R-CNN, který dokáže v obrázku detekovat objekty různých velikostí. K tomu využiješ šikovnou třídu MultiScaleRoIAlign() z balíčku torchvision.ops.

Třída FasterRCNN byla naimportována z torchvision.models.detection. anchor_generator z předchozího cvičení máš k dispozici ve svém pracovním prostředí a torch, torch.nn jako nn a torchvision jsou také naimportovány.

Pokyny

100 XP
  • Naimportuj MultiScaleRoIAlign z torchvision.ops.
  • Vytvoř instanci RoI pooleru pomocí MultiScaleRoIAlign s parametrem featmap_names nastaveným na ["0"], output_size na 7 a sampling_ratio na 2.
  • Sestav model Faster R-CNN a předej mu backbone, num_class pro binární klasifikaci, anchor_generator a roi_pooler.