1. 学ぶ
  2. /
  3. コース
  4. /
  5. PyTorch で学ぶ画像向け Deep Learning

Connected

演習

画像テンソル

コーヒー会社が、興味のある物体(ここではエスプレッソショット)にアノテーションを付ける Object Detection プロジェクトを進めています。あなたはエスプレッソショット画像のバウンディングボックス座標のリストを作成しました。次に、画像と座標をテンソルに変換する必要があります。

torch と torchvision はインポート済みです。torchvision.transforms は transforms としてインポートされています。画像は PIL ライブラリの Image.open() を使って image として読み込まれています。バウンディングボックスの座標は変数 bbox に保存されています。

espresso

指示

100 XP
  • torch.tensor() を使って bbox をテンソルに変換します。
  • unsqueeze(0) を使ってバッチ次元を追加し、bbox_tensor の形状を変更します。
  • image を (224) にリサイズし、スケーリングされていない画像テンソルに変換する transform を作成します。
  • transform を image に適用します。